sourcecode

TesseractNotFound 오류를 해결하려면 어떻게 해야 합니까?

codebag 2023. 5. 13. 09:40
반응형

TesseractNotFound 오류를 해결하려면 어떻게 해야 합니까?

Python에서 pyteseract를 사용하려고 하지만 항상 다음 오류가 발생합니다.

    raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path

하지만 내 시스템에 pyteseract와 tesseract가 설치되어 있습니다.

이 오류가 발생하는 코드의 예:

import cv2
import pytesseract

img = cv2.imread('1d.png')
print(pytesseract.image_to_string(img))

이 TesseractNotFound 오류를 해결하려면 어떻게 해야 합니까?

가 설치기때이오발생다니습했류를 에 이 했습니다.pytesseract와 함께pip바이너리를 설치하는 것을 잊었습니다.

리눅스에서

sudo apt update
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev

Mac에서

brew install tesseract

Windows에서

https://github.com/UB-Mannheim/tesseract/wiki 에서 바이너리를 다운로드합니다.그 다음에 추가pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe' 경로 ) (tesseract binary 경로 )

참조 자료: https://pypi.org/project/pytesseract/ (설치 섹션) 및 https://github.com/tesseract-ocr/tesseract/wiki#installation

다른 사람들이 언급한 것처럼 경로 변수를 추가하려고 했지만 여전히 동일한 오류가 발생했습니다.효과가 있었던 것은 이것을 내 대본에 추가하는 것이었습니다.

피테세릭pytesseract.tesseract_continue = r"C:\프로그램 파일(x86)\Tesseract-OCR\tesseract.exe"

당은아없것다니입을마신▁missing▁probably를 놓치고 있을 것입니다.tesseract-ocr당신의 기계에서.https://github.com/tesseract-ocr/tesseract/wiki 에서 설치 지침을 확인하십시오.

Mac에서는 홈브루를 사용하여 설치할 수 있습니다.

brew install tesseract

그 후에는 잘 작동할 것입니다.

Windows 10 OS 환경에서는 다음과 같은 방법을 사용할 수 있습니다.

  1. https://github.com/tesseract-ocr/tesseract/wiki tesseract를 다운로드하여 설치합니다.Windows 버전은 https://github.com/UB-Mannheim/tesseract/wiki 에서 사용할 수 있습니다.

  2. 파일 pytesseract.pyC:\Users\User\Anaconda3\Lib\site-packages\pytesseract열다세요보. 코음변에서 다음 합니다.tesseract_cmd = 'tesseract'대상:tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

  3. 환경 변수 추가가 도 있습니다.D:/Program Files (x86)/Tesseract-OCR/

그것이 당신에게 효과가 있기를 바랍니다!

저는 Mac OS에서 실행 중이고 양조와 함께 테세랙트를 설치했습니다. 그래서 이것에 대한 저의 견해는 이렇습니다.pytheseract는 python에서 teseract에 액세스할 수 있는 방법이기 때문에 컴퓨터에서 teseract가 이미 있는 위치를 지정해야 합니다.

Mac OS의 경우

테세르 작용하는 곳을 찾아보세요.exeis- brew를 사용하여 설치한 경우 터미널에서 다음을 사용합니다.

>brew list tesseract

이것은 당신의 테세레이션이 어디에 작용하는지를 나열할 것입니다.exe는, 어느 정도 비슷한 곳입니다.

> /usr/local/Cellar/tesseract/3.05.02/bin/tesseract

그리고 나서 그들의 지시를 따릅니다.

pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'

피테세릭pytesseract.tesseract_continue = r'/usr/local/Cellar/tesseract/3.05.02/bin/tesseract'

그 묘기를 부려야 합니다!

Mac의 경우:

  1. Pyteseract 설치(pip 설치 Pyteseract가 작동해야 함)
  2. 테세랙트 설치하는데 홈브루로만, pip 설치가 어떻게든 작동하지 않습니다. (브루 설치 테세랙트)
  3. 단말기에 Tesseract의 Brew 설치 경로를 확인합니다(Brew list tesseract
  4. syspath가 아닌 코드에 경로를 추가합니다.경로는 pyteseract를 사용하여 코드와 함께 추가됩니다.pytesseract.tesseract_message = '<3단계에서 받은 경로>' - (예: pytesseract).pytesseract.tesseract_message = '/usr/local/Cellar/tesseract/4.0.0_1/bin/tesseract')

이것은 잘 될 것입니다.

주피터 노트북에서 제게 실제로 효과가 있었던 한 가지 간단한 것은 파이테서랙트에서 단일 백슬래시 대신 이중 백슬래시를 사용하는 것이었습니다.pytesseract.tesseract_vlan 경로:

pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'

주의: WINDOWS에만 해당


저는 오늘 이 문제를 접했고 여기에 언급된 모든 답변들이 저에게 도움이 되었지만, 저는 그것을 해결하기 위해 개인적으로 많은 것을 파야 했습니다.따라서 매우 간단한 형태로 해결책을 제시함으로써 다른 모든 사람들을 도울 수 있습니다.

  1. 여기에서 실행 파일 64비트(컴퓨터가 32비트인 경우 32비트) exe를 다운로드합니다.

    (파일 이름은 tesseract-ocr-w64-setup-v5.0.0.20190526(알파))

  1. 설치합니다.기본 C 디렉터리에 설치되도록 합니다.

  2. 환경 변수로 ).Control Panel > System > Advanced System Settings > Environment Variables)

PATH를 선택한 다음 Edit(편집)을 선택합니다.으로 NEW는 설치된 경로입니다).C:\Program Files\Tesseract-OCR\)

이제 오류가 발생하지 않습니다!

저도 같은 문제에 직면해 있습니다.저는 저를 도와줄 이 명령을 사용할 뿐입니다.

sudo apt install tesseract-ocr

Ubuntu에서만 작동합니다.
sudo 명령인 반면, 는 (리눅스, Mac, Rasbian 등)입니다.aptUbuntu에만 해당됩니다.

저도 같은 문제에 직면했습니다.여기서부터 설치하고 작업도 완료했으면 합니다.pip install pytesseract.

만약 모든 것이 괜찮다면, 당신은 그 길을 보아야 합니다.C:\Program Files (x86)\Tesseract-OCR where tesseract.exe사용할 수 있습니다.

경로 변수를 추가하는 것은 도움이 되지 않았습니다. 실제로 이름으로 새 변수를 추가했습니다.tesseract이 값다 음과 환변서에인 C:\Program Files (x86)\Tesseract-OCR\tesseract.exe.

자치 기타를 합니다.tesseract이제 명령줄에서 사용 정보를 제공하여 예상대로 작동합니다.이제 사용할 수 있습니다.pytesseract(이를 실행하기 전에 파이썬 커널을 다시 시작하는 것을 잊지 마십시오!):

import pytesseract
from PIL import Image

value=Image.open("text_image.png")
text = pytesseract.image_to_string(value, config='')    
print("text present in images:",text)

즐기세요!

저도 pyteseract를 사용하여 텍스트 추출기를 만들려 할 때 같은 오류에 직면했지만, 솔루션은 pyteseract in pypi site에 pyteseract 설치 지침에 있었습니다: pyteseract 오류를 피하기 위한 많은 대안이 있지만, pytesseract.image_to_string 메서드에 매개 변수를 하나 더 추가하여 해결했습니다.

tessdata_dir_config = "/usr/share/tesseract-ocr/4.00/tessdata"
output = pytesseract.image_to_string(image, lang='eng', config=tessdata_dir_config)

다음 세 가지 명령을 사용하면 필요합니다.

sudo apt update
# This will update your packages
sudo apt install tesseract-ocr
# This will install OCR
sudo apt install libtesseract-dev
# This will add it as development dependency

다음 링크를 사용하여 tesseract-ocr 설정을 다운로드할 수 있습니다.

창에 대한 테세랙트

그런 다음 C:\Program Files (x86)\ 값을 가진 환경 변수에 teseract라는 이름의 새 변수를 추가합니다.Tesseract-OCR\tesseract.exe

https://github.com/UB-Mannheim/tesseract/wiki 에서 teseract를 설치하고 teseract 경로를 추가합니다.exe를 경로 환경 변수에 추가합니다.

다른 버전의 Python이 설치되어 있을 가능성이 높습니다. 설치된 Tesseract가 동일한 Python 버전에 있는지 확인하십시오.

which pip3pip3 설치 경로를 보여줍니다.which python3에는 Python 설치에 대한 해당 경로가 나와 있습니다.

이 두 가지가 동일한지 확인합니다.

현재 디렉터리가 teseract가 설치된 드라이브와 다른 드라이브에 있을 때 Windows(최소한 tesseract 버전 3.05)에서 이 문제가 발생합니다.

tesseract에서 데이터 파일이 \Program Files에 있을 것으로 예상합니다...(예: C:\Program Files가 아닌).따라서 테세랙트와 동일한 드라이브 문자를 사용하지 않으면 실패합니다.테세랙트를 실행하기 전에 임시로 드라이브를 테세랙트 설치 드라이브로 변경했다가 나중에 다시 변경하는 방법으로 해결할 수 있으면 좋겠습니다.예를 들어 다음과 같습니다.module_python.py를 "C/Program Files(x86)/Tesseract-OCR/"에 복사하고 RUN!

경로를 설정하는 몇 가지 단계가 있습니다.

1: 이 "https://github.com/UB-Mannheim/tesseract/wiki "으로 이동합니다.

2: 최신 설치 프로그램 다운로드

3: 설치

4: "C:"와 같은 시스템 변수에 경로를 설정합니다.\프로그램 파일\Tesseract-OCR" 또는 "C:\Program Files(x86)\테세락-OCR"

5: CMD 유형 "tesseract"를 열고 "not regonized type errors"를 제외한 일부 출력을 표시합니다.

Ubuntu의 플라스크 웹 프레임워크에서는 이것이 작동해야 합니다.

pytesseract.pytesseract.tesseract_cmd = r"/usr/bin/tesseract"
img = Image.open(picture_name)
print(pytesseract.image_to_string(img))

가져오시겠습니까?

from tesseract import image_to_string

pyteseract에서 가져오지 않음

저도 같은 문제에 직면해 있었습니다. 추가하세요.C:\Program Files (x86)\Tesseract-OCR경로 변수로 이동합니다.안 그도래작지않추으가면동하추가▁if▁add않면으지▁does▁still▁it작,를 추가합니다.C:\Program Files (x86)\Tesseract-OCR\tessdata새 줄에 있는 경로 변수로 이동합니다.경로 변수를 추가한 후 컴퓨터를 다시 시작하는 것을 잊지 마십시오.

현재 Windows를 사용하고 있으며 PDF 파서를 개발해야 하지만 다음을 통해 새로운 환경 변수를 추가합니다.sysdm.cpl혼자서는 작동하지 않았습니다.사용자들에게는 다른의경다추좋것다습니이가는하음을 추가하는 것을 추천합니다.C:\Program Files (x86)\Tesseract-OCR의 신에게에.profile.ps1(Powershell을 사용하는 경우)도 마찬가지입니다.

작은 실수입니다. 업데이트된 경로를 반영하려면 cmd를 열거나 닫아야 한다는 것을 알고 있었습니다.주피터 노트북을 사용하여 클라이언트를 종료하고 다시 초기화해야 했습니다.

Linux를 사용하는 경우 이 명령을 실행하면 됩니다.

sudo apt update
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev

그럼 이걸 실행해봐요.

python -m pip install tesseract tesseract-ocr pytesseract

나에게 그것은 하나의 인용문을 넣는 것으로 작동했습니다.

pytesseract.pytesseract.tesseract_cmd =r'C:/Program Files/Tesseract-OCR/tesseract.exe'

실제로 이중 따옴표를 넣는 것은 자동으로 원하지 않는 문자를 삽입하는 것이었습니다.

이것이 나의 길입니다.

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"  # your path may be different

경로를 변경했습니다.

path_to_tesseract = 'C:\Program Files\Tesseract-OCR\tesseract.exe'
to 
path_to_tesseract = r'C:/Program Files/Tesseract-OCR/tesseract.exe' 

나를 위해 해결된 문제

언급URL : https://stackoverflow.com/questions/50655738/how-do-i-resolve-a-tesseractnotfounderror

반응형