OCR 기술이란 무엇입니까?

OCR은 Optical Character Recognition(광학 문자 인식)의 약자로 종이에 인쇄된 문자를 검사하여 어둡고 밝은 패턴을 감지하여 모양을 판별하는 전자 장치(스캐너, 디지털 카메라 등)를 말합니다. , 문자인식을 이용한 방법 : 도형을 컴퓨터 텍스트로 변환하는 과정, 즉 텍스트 데이터를 스캔한 후 이미지 파일을 분석 및 처리하여 텍스트 및 레이아웃 정보를 얻는 과정. OCR 개발 개요 OCR의 개념은 1929년 독일 과학자 Tauscheck에 의해 처음 제안되었습니다. 이후 미국 과학자 Handel도 기술을 사용하여 텍스트를 인식하는 아이디어를 제안했습니다. 인쇄된 한자 인식을 최초로 연구한 사람은 IBM의 Casey와 Nagy였습니다. 그들은 1,000개의 인쇄된 한자를 식별하는 템플릿 매칭 방법을 사용하여 한자 인식에 관한 첫 번째 논문을 발표했습니다. 1970년대 초 일본 학자들은 한자 인식에 대한 연구를 시작하여 많은 연구를 진행했다. 우리나라의 한자 인식 연구는 비교적 늦게 시작되었고, OCR 연구 작업은 1970년대 후반에야 시작되었다. 초기 OCR 소프트웨어는 인식률, 제품화 등 다양한 요인으로 인해 실제 요구 사항을 충족하지 못했습니다. 동시에 하드웨어 장비의 가격이 높고 실행 속도가 느리기 때문에 실용적인 수준에 도달하지 못했습니다. 정보부, 언론, 출판부 등 특정 부서에서만 OCR 소프트웨어를 사용합니다. 1986년 이후 우리나라의 OCR 연구는 한자 모델링과 인식 방법에서 큰 진전을 이루었으며 많은 단위에서 중국어 OCR 제품을 출시했습니다. 1990년대에 접어들면서 우리나라에서는 평판스캐너가 널리 보급되고 정보자동화, 사무자동화가 대중화되면서 OCR 기술의 발전이 크게 촉진되어 OCR의 인식정확도와 인식속도가 대다수 사용자의 요구를 충족하게 되었다. . 필요하다. 현재 널리 사용되는 OCR 소프트웨어는 OmniPage입니다. 주요 중국어 OCR 소프트웨어는 Tsinghua Unigroup OCR, Tsinghua Wentong OCR, Hanwang OCR, Zhongjing Shangshu OCR, Danqing OCR, Mengtian OCR 등입니다. 한자는 크기가 크고 모양이 복잡하지만 OCR 기술은 성숙해졌습니다. 많은 OCR 소프트웨어는 흑백으로 인쇄된 한자뿐만 아니라 회색조 및 컬러로 인쇄된 한자도 인식할 수 있으며 인식 속도가 매우 빠르고 인식 정확도가 99% 이상에 달합니다. 여러 글꼴과 다양한 글꼴 크기의 혼합 배열을 인식합니다. 일부 OCR 소프트웨어는 이미지와 표도 인식할 수 있습니다. 동시에 필기 한자 인식에 관한 연구도 큰 진전을 이루었으며 정확한 인식률은 70% 이상에 이르렀습니다. OCR 소프트웨어 적용 스캐너 시장에서는 Ziguang의 스캐너에 Ziguang OCR, Zhongjing의 스캐너에 Shangshu OCR, Mustek의 스캐너에 Danqing OCR 등 OCR 소프트웨어가 탑재된 다양한 유형의 사무실 및 가정용 스캐너가 있습니다. . 스캐너와 OCR 소프트웨어는 문서 입력부터 텍스트 인식까지 전체 프로세스를 공동으로 수행합니다. 문서 스캐닝은 사무실 현장에서 많이 사용됩니다. 신문, 잡지, 기타 매체에 게재된 관련 문서를 스캐너를 통해 스캔한 후 OCR 인식을 수행하거나, 나중에 OCR 인식을 위해 이미지 파일로 저장한 후 이미지 파일을 변환합니다. 텍스트 파일이나 Word 파일로 저장합니다. 또한, 디지털 정보의 저장 및 전송은 저비용, 고효율일 뿐만 아니라 조판, 네트워크 전송 등의 지속적인 개발 요구에 적응할 수 있습니다. 현재 우리나라에는 역사 속에 남겨진 서적, 신문, 잡지 등 종이 보물이 많이 남아 있어 이를 전자정보화하는 것이 시급하다. 예를 들어, 전자 도서관을 구축하려면 책을 페이지별로 스캔해야 하며 OCR 소프트웨어의 인식이 결합되어 수동으로 텍스트를 입력하는 작업을 대체하여 입장 시간을 크게 단축하고 노동 강도를 줄이고 인력을 절약하며 비용을 절감합니다. 정확성, 업무 효율성 및 현대적인 사무 자동화. 현재 OCR 소프트웨어와 스캐너의 결합은 디지털 도서관, 다양한 보고서 식별, 은행 및 세금 시스템 청구서 식별 등 정보화 시대의 많은 분야에 적용되고 있습니다.

네트워킹과 정보화의 발전과 대중화로 인해 그 활용 범위는 점점 더 넓어질 것입니다. OCR 시스템의 구성은 한자 인식 소프트웨어 OCR의 기능은 입력된 다양한 한자, 인쇄 또는 필기 문자에서 각 한자의 그래픽이나 이미지를 컴퓨터를 사용하여 인식하고 한자 카테고리 코드를 표시하는 것입니다. 그러므로 한자 인식은 결국 이미지 인식의 문제이다. 한자는 많은 양의 정보를 담고 있고, 다양한 상형 문자, 글꼴, 복잡한 구조를 갖고 있기 때문에 한자 인식 과정이 매우 복잡합니다. 스캐너의 인기와 광범위한 적용으로 인해 OCR 소프트웨어는 스캐너와의 인터페이스를 제공하고 스캐너 드라이버 소프트웨어만 사용하면 됩니다. 따라서 OCR 소프트웨어는 주로 이미지 처리 모듈, 레이아웃 분할 모듈, 텍스트 인식 모듈, 텍스트 편집 모듈의 네 부분으로 구성됩니다. 1. 이미지 처리 모듈 이미지 처리 모듈에는 주로 문서 스캔, 이미지 크기 조정, 이미지 회전과 같은 기능이 있습니다. 문서는 스캐너를 통해 입력된 후 이미지 파일을 형성하는데, 이미지 처리 모듈은 이미지를 확대하여 얼룩이나 긁힌 부분을 제거할 수 있으며, 이미지가 올바르게 배치되지 않은 경우 이미지를 수동 또는 자동으로 회전시켜 생성할 수 있습니다. 텍스트 인식 조건이 향상되어 인식률이 높아집니다. 2. 레이아웃 분할 모듈 레이아웃 분할 모듈에는 주로 레이아웃 분할과 변경 분할, 즉 레이아웃의 이해, 단어 분할, 정규화 등이 포함됩니다. 레이아웃 분할 방법에는 자동과 수동의 두 가지가 있습니다. 목적은 OCR 소프트웨어에 동일한 페이지의 기사, 표 등을 분리하여 별도로 처리하고 어떤 순서로 식별할 수 있는지 알려주는 것입니다. 3. 문자 인식 모듈 문자 인식 모듈은 OCR 소프트웨어의 핵심 부분입니다. 문자 인식 모듈은 주로 입력된 한자를 "읽지만" 한 번에 여러 줄을 사용할 수 없으며 한 줄씩 잘라야 합니다. 한자는 대개 하나씩 인식됩니다. 즉, 단일 단어 인식을 한 다음 정규화합니다. 문자 인식 모듈은 다양한 샘플 한자의 특징을 추출하여 인식을 완료하고 의심스러운 문자를 자동으로 검색하며 정방향 및 역방향 연관과 같은 기능을 갖습니다. 4. 텍스트 편집 모듈 텍스트 편집 모듈은 주로 OCR 인식 후 텍스트를 수정 및 편집합니다. 시스템이 잘못된 것으로 인식하면 텍스트가 눈길을 끄는 빨간색 또는 파란색으로 표시되고 유사한 텍스트가 선택을 위해 제공됩니다. 출력 등을 위한 편집기를 선택합니다. OCR 소프트웨어 사용 방법 OCR 소프트웨어에는 여러 유형이 있지만 사용 방법은 비슷합니다. 먼저 문서를 스캔한 후 OCR 인식을 수행하세요. OCR 소프트웨어 사용 방법은 다음과 같습니다. 1. 문서 스캔 텍스트 인식을 위해 OCR 소프트웨어를 사용하려면 OCR 소프트웨어에서 직접 문서를 스캔할 수 있습니다. OCR 소프트웨어를 실행하면 OCR 소프트웨어 인터페이스가 나타납니다. 스캔할 문서를 스캐너의 유리 표면에 놓고, 스캔할 면이 스캐너의 유리 표면을 향하고 문서의 상단 끝이 아래를 향하도록 하여 눈금자의 가장자리에 맞춘 다음 스캐너를 덮고 스캔할 준비가 되었습니다. 스캔을 위한 스캔 드라이버 소프트웨어를 시작하려면 창에서 "스캔" 버튼을 클릭하십시오. 스캔 방법은 여기서 설명하지 않습니다. 그러나 해상도는 200~400dpi 사이에서 설정할 수 있습니다. 텍스트 문서의 경우 밝기를 적당한 수준으로 조정하는 것이 중요합니다. 스캔한 문서 이미지가 OCR 소프트웨어 창에 나타납니다. 2. OCR 인식 간편한 조작을 위해 메뉴에서 옵션을 선택할 수 있으며, 창 왼쪽에 다양한 아이콘이 나타납니다. 더 나은 사용을 위해 먼저 화면 왼쪽에 있는 아이콘을 위에서 아래로 소개합니다. "확대" 도구: 이미지를 확대하는 데 사용됩니다. "축소" 도구: 이미지를 줄이는 데 사용됩니다. : 인식 영역을 설정하는 데 사용됩니다. "인식 순서 설정" 도구: 인식 영역을 삭제하는 데 사용됩니다. "이미지 노이즈 지우기" 도구: 이미지의 노이즈를 삭제하는 데 사용됩니다. "지우기" 이미지 블록 도구: 이미지의 영역 지우기용, 이미지 회전 도구: 이미지를 90°, 180° 또는 270° 회전하기 위한 도구: 수동 이미지 기울기 교정용. OCR 인식을 위한 일반적인 단계: (1) 문서를 스캔한 후 창에 처음 나타나는 인식할 텍스트는 매우 작습니다. 먼저 "확대" 도구를 선택하여 화면을 적절하게 확대하여 더 명확하게 봅니다. 필요한 경우 "축소" 도구를 선택하여 화면 크기를 적절하게 줄일 수도 있습니다. (2) 이미지를 90°, 180° 또는 270° 회전해야 하는 경우 "이미지 회전" 도구를 사용하여 이미지를 회전할 수 있습니다. 텍스트 화면이 기울어진 경우 "기울기 보정" 도구를 선택하여 화면을 똑바르게 만들 수 있습니다.

(3) 인식 시 "인식 영역 설정" 도구를 선택하여 텍스트 화면에서 인식할 영역을 프레임 지정합니다. 이때 화면 조건에 따라 여러 영역을 프레임 지정할 수도 있습니다. 프레임 영역이 잘못된 경우 "인식 영역 삭제" 도구를 사용하여 선택한 인식 영역을 삭제할 수 있습니다. (4) 인식률을 높이기 위해 선택한 인식 영역에 노이즈 얼룩이 있거나 인식할 수 없는 이미지가 있는 경우 "이미지 노이즈 얼룩 제거" 도구를 선택하여 노이즈 얼룩을 조금씩 지울 수 있습니다. 패치를 지워야 하는 경우 이미지 블록 지우기 도구를 선택할 수 있습니다. (5) "인식" 아이콘을 클릭하면 OCR에 텍스트가 분할되는 것으로 표시되며, 이후 "인식 중" 화면으로 전환되며, 인식된 텍스트가 점차적으로 "원고 교정" 창에 표시됩니다. 많은 OCR 소프트웨어에는 텍스트 수정 기능이 있습니다. 오류가 있는 것으로 식별될 수 있는 텍스트는 더 밝은 색상으로 표시되며 수정할 수 있습니다. (6) 인식된 파일을 텍스트(TXT) 파일이나 Word RTF 파일로 저장합니다.

上篇: IPS 모니터란 무엇입니까? 下篇: 양자기술이란 무엇인지 알기 쉽게 설명할 수 있나요?