LEADTOOLS Document Analyzer SDK 라이브러리



LEADTOOLS Document Analyzer SDK 라이브러리는 문서 자동화 처리와 스마트 데이터 추출을 위해 텍스트 기반의 사무용 문서(DOC, DOCX, XLS, XLX)와 PDF, 문서 이미지(JPG, TIFF, PNG, PDF)에서 문서 컴포넌트와 영역(Field)을 지능적으로 식별합니다. LEADTOOLS Document Analyzer는 IDP(지능형 문서 처리/Intelligent Document Processing)를 사용하여 구조화/비구조화 문서의 핵심 문구를 자동으로 찾고 파일 간의 레이아웃이 완전히 다른 경우에도 노이즈가 있어도 데이터를 추출합니다. 또한, 이 컴포넌트는 심층 분석을 통해 항목이 누락되지 않도록 하고, 관심 있는 모든 데이터를 찾을 수 있도록 탐지 기능이 더욱 향상되었습니다. 다양한 유형의 양식과 문서를 처리하는 애플리케이션을 구축하는 .NET 6+, .NET Framework, Xamarin, UWP, .NET MAUI, C#, VB, Java, HTML/JavaScript 개발자는 사용하기 쉬운 API를 통합하여 큰 이점을 얻을 수 있습니다.


 

지능형 문서 처리(IDP) 컴포넌트
(Intelligent Document Analyzer Component)

AI와 기계 학습(Machine Learning)에 대한 투자를 통해 LEAD는 간단한 규칙 기반의 설정을 통해 모든 유형의 구조화 또는 비 구조화 양식, 문서, 이미지에서 데이터를 자동으로 탐지하고 추출하는 Document Analyzer SDK를 개발하였습니다. 

타사 도구나 애플리케이션이 필요 없는 모든 Document Analyzer 기능을 제공합니다. 여기에는 다음 기능이 포함되어 있습니다 :    

  • 관련된 위치를 포함하는 위치 검색
  • 결과 일치와 필터링을 위한 조건부 검색
  • 부분/전체 매칭 Regex 지원
  • SSN, ID 번호, TaxID, 주소, 이메일 주소 등 일반 데이터 유형에 대한
    사전 정의된 규칙
  • 관심 있는 정보를 찾고, 수집하고, 조치하는 맞춤형 특화 규칙 세트를
    추가하는 기능
  • 관심 데이터에 수정, 강조 표시, 추출 등의 작업을 적용 가능

테이블, 텍스트 흐름, 여러 개의 줄이 포함된 데이터를 포함하는 다양한 데이터 형식 처리

문서 관리 시스템의 공간 절약
(Save Space in your Document Management System)

의료, 금융, 보험 등 다양한 산업에서 정기적으로 처리되는 민감한 데이터가 포함된 모든 문서에 있어 일반적인 문제점은 수동으로 데이터를 편집하고 파일을 저장하는 것 입니다. 문서를 수동으로 저장하고 수정된 파일과 수정되지 않은 파일을 모두 문서 관리 시스템에 저장하려면 시간과 공간이 많이 필요할 수 있습니다. LEADTOOLS Document Analyzer의 강력한 머신 비전(Machine Vision) 라이브러리를 통해 사용자는 수정되지 않은 파일만 저장하고, 시스템은 파일 요청이 들어 올 때 자동으로 즉시 수정할 수 있습니다.

스마트 데이터 추출
(Smart Data Extraction)

LEAD의 강력한 Forms Recognition & Processing 라이브러리를 활용하여 Document Analyzer는 텍스트 기반의 사무용 문서(DOC, DOCX, XLS, XLX)와 PDF, 문서 이미지(JPG, TIFF)에서 텍스트, 단락 또는 키 값을 규칙에 근거하여 지능적으로 추출합니다. 이런 스마트 데이터 추출 기능으로 파일 간 레이아웃이 완전히 다른 경우에도 송장이나 명세서, 선하증권, 영수증 등 정형/비정형 문서에서 작동하는 핵심 문구를 자동으로 찾아 냅니다. 또한 이 컴포넌트는 심층 분석을 통해 탐지 기능을 더욱 향상시켜 관심 있는 모든 데이터를 발견하고 누락되는 것이 없도록 보장합니다.

모든 사용자를 위한 인터페이스
(An Interface for Any User)

Document Analyzer는 사용자 편의성을 위해 설정 기반의 애플리케이션으로 제공되며 최고의 유연성을 위해 .NET과 Java 클래스를 제공합니다.

복합 컨텐츠 까지 모든 인풋 분석
(Analyze Any Input – Even Mixed Contents)

Document Analyzer는 특허 받은 기계 학습 알고리즘으로 구축된 LEADTOOLS 자체 OCR 기술을 완벽하게 통합하여 텍스트 기반의 파일, 이미지 기반의 파일 또는 텍스트와 이미지 컨텐츠가 혼합된 파일을 포함한 모든 종류의 입력을 처리합니다.

편리한 통합성
(Easy to Integrate)

힘든 일은 LEADTOOLS가 처리 합니다. R&D 시간 투자 없이 최고의 품질과 성능을 제공하므로 개발자는 개발하는 응용프로그램에 필요한 다른 콤퍼넌트에 집중할 수 있습니다. LEADTOOLS를 사용하면 개발이 얼마나 간편해지는지 지금 평가판을 다운 받아 코딩을 시작해 보십시오.

신뢰 등급(Ratings) 제공
(Confidence Ratings Provided)

Document Analyzer는 인식된 값을 사용자가 개별적으로 수락하거나 거부할 수 있는 신뢰 등급을 제공합니다. 솔루션 개발자는 부여된 등급을 활용하여 다음 Workflow를 완벽하게 제어하며 인식된 값을 자동으로 수락하거나 거절할 수 있습니다.

문서 분석기 SDK 플랫폼/프로그래밍 인터페이스
(Document Analyzer SDK Platform and Programming Interface)

운영체제

LEADTOOLS 문서 분석기 라이브러리를 사용하는 프로젝트는 Windows, Linux , macOS , Android , iOS 및 Web 장치에 배포될 수 있습니다 .

프레임워크

다음 프레임워크를 활용하는 개발자가 Document Analyzer SDK를 사용할 수 있습니다. : .NET 6+ , .NET Framework , Xamarin , UWP , WinForms, ASP.NET , Web Services / Web API (JSON, SOAP, REST), .NET MAUI 

프로그래밍, 스크립팅, 마크업

C#, VB, XAML, JavaHTML / JavaScript를 위한 Document Analyzer 코드 스니펫과 데모 애플리케이션을 제공합니다.

LEADTOOLS 문서 분석기로 코딩을 시작해 보세요

Windows, Linux 및 macOS를 포함하는 모든 개발과 타겟 플랫폼을 위한 Document Analyzer 라이브러리뿐만 아니라 모든 LEADTOOLS 인식, 문서, 의료, 벡터 및 이미징 기술을 다운로드 받아 코딩할 수 있습니다.  

관련 문서(Documentation)