리뷰/무형물

중국 사이버 강의 필수템 天若(Tianruo) OCR (중국어 OCR 추천)

Hexagon_ 2020. 7. 8. 11:09

간혹 강의를 듣다보면 피피티를 수업 끝나고 공개하거나 아예 공개하지 않는데 수업시간에는 거의 1초에 한 장 수준으로 순식간에 넘겨버리는 교수님들이 계신다. 학생들이 피피티를 빠짐없이 베끼지 말것을 의도하신건지, 아니면 단순히 말하느라 우리의 타자 속도가 그렇게 빠르다는걸 인지하지 못하시는건지.

때문에 대면 강의할때는 사진을 찍어서 컴퓨터로 옮겨서 원노트에 붙여넣거나, 사이버 강의라면 더 손쉽게 캡쳐해서 바로 원노트에 붙여넣는 방법이 있었지만, 글씨가 아닌 사진이다보니 나중에 검색하기도 어렵고(원노트 자체 OCR은 음...없다고 생각하는게 편한듯), 그 위에다 내용을 수정하거나 추가하는게 어렵다는(아이패드를 사면 해결될텐데) 문제점이 존재했다.

 

어느날 여느때와 다름없이 몇번이나 폭풍타자하다가 절반밖에 못쳤는데 교수님이 피피티를 넘겨버리셔서 "나는 누구인가 수업은 왜 듣는것인가"라는 현타가 와서 그날 수업은 포기하고 그냥 눈과 귀로 듣던 중,

갑자기 "OCR 프로그램을 쓰면 타자 칠 필요가 없을텐데?" 라는 생각이 떠올랐다.

 

이마탁.gif

왜 중간고사까지 다 치고나서야 생각이 난걸까...

그래도 지금이라도 늦지 않았다는 심경으로 중국어 OCR에 대해 구글링하던중, 天若OCR(이하 Tianruo OCR)이라는 마음에 드는 프로그램을 발견하게 되었고, 덕분에 내 싸강라이프의 삶의 질이 수직상승했다. 북경사이버대학을 다니고 내 인생이 달라졌다

 


우선 이 링크를 들어가 다운로드한다: https://tianruoocr.cn/

 

天若OCR文字识别

高级识别 调整识别对比度,自动绘制表格线

tianruoocr.cn

사이트에 들어가서 자신의 컴퓨터가 32비트인지 64비트인지에 맞게 다운로드한다. 나는 64비트니 下载64位를 선택했다.

저 밑에 왕이되는자가 연상되는 광고는 무시하자.

다운로드 버튼이 电信下载(차이나텔레콤 다운로드)、联通下载(차이나유니콤 다운로드)、普通下载(일반 다운로드)가 나오는데 앞 두개는 괜히 이상한 프로그램 다운받으라고 할까봐 일반 다운로드를 클릭했다.

그리고 말이 일반이지 한국 인터넷은 빠르므로 몇초면 다운로드된다.

 

압축을 풀면 이렇게 나온다. Tianruo OCR은 별도의 설치가 필요없는 휴대용 소프트웨어기 때문에, 저 TianruoOCR64.exe 버튼을 누르면 설치 과정 없이 바로 실행이 된다. 중국 컴퓨터 프로그램들은 설치 과정에서 컴퓨터에다가 이상한 짓을 많이 하기 때문에 이 점이 마음에 든다.

 

Windows Defender에서 인식할 수 없는 프로그램이라고 하는데...위험을 감지한게 아니라 단순히 인식할 수 없는거라고 하니 그냥 "상세 정보" 눌러서 실행시키면 된다.

그럼 화면 한쪽에 저렇게 생긴 툴바가 뜨는데, 저기서 T 버튼을 누르거나 단축키인 F4를 누르면 화면 위 글자를 선택하는 화면이 나온다. 글자 부분을 드래그하면...

 

...먼저 로그인하라는 화면이 나온다.

저 창 오른쪽 상단에 登录(login) 버튼을 눌러준다.

로그인 화면이 나오면 邮箱(이메일) 옆 注册账号(계정 가입, 근데 글씨가 짤린듯)을 눌러 회원가입을 진행한다.

이메일, 닉네임, 비밀번호만 입력하면 끝이다. 단 비밀번호 규정이 다소 괴랄해서 가입할때 다소 짜증날수도.

 


가입을 마치고 로그인을 했다면 본격적으로 테스트해보자.

https://www.apple.com.cn/ipad-pro/

테스트에 사용된 문구는 중국 애플 공홈의 아이패드 프로 소개문구.

你的下一台电脑,何必是电脑 문장 중간의 쉼표를 빠뜨리고 두 줄을 한 줄로 인식한것과, 마지막 Pro의 P가 대문자가 아니고 마침표를 빠뜨린 것 외에는 전혀 오차가 없었다.

https://www.thepaper.cn/newsDetail_forward_8173170

오로지 중국어와 숫자밖에 없고 강제개행이 없는 뉴스 기사는 인식 정확도가 더 높았다.

 

한가지 팁이라면, 인식된 글자는 자동으로 클립보드에 복사되기 때문에 따로 복사할 필요 없이 붙여넣어야 할 곳에 바로 Ctrl+V하면 된다.

 


바이두의 무료 OCR API를 사용하는 Tianruo OCR의 일반 문구 인식 기능은 아직까진 완전히 무료이다. 하지만 표 인식, 세로쓰기 인식, 공식(무려 LaTeX로 복사를 지원한다 카더라) 인식, 자동 번역 기능은 따로 API를 구매해야한다. 언제 프로그램이 망할지 몰라서 아직까지는 그냥 무료 기능으로 잘 사용하는중.