Вольны план: 1 conversion/hour, 1 file at a time
Неабмежаваная →

Канвертаваць PDF да TXT

Пераўтварыце Свой PDF да TXT дакументы без асаблівых высілкаў

Выберыце свае файлы

*Файлы выдаляюцца праз 24 гадзіны

Канвертаваць файлы да 1 ГБ бясплатна, карыстальнікі Pro могуць канвертаваць файлы да 100 ГБ; Зарэгіструйцеся зараз

Загрузка

0%

Як канвертаваць PDF да TXT

Крок 1: Загрузіце свой PDF файлы з дапамогай кнопкі вышэй або шляхам перацягвання.

Крок 2: Націсніце кнопку «Канвертаваць», каб пачаць пераўтварэнне.

Крок 3: Загрузіце пераўтвораны файл TXT файлы


PDF да TXT Частыя пытанні па канверсіі

Як пераўтварыць PDF у рэдагуемы дакумент TXT?
+
Загрузка PDF і канвэртар выцягвае яго тэкст — запускаючы OCR (оптычнае распазнаванне сімвалаў), калі PDF з'яўляецца сканаваннем або малюнкам, або выцягваючы тэкставы пласт, калі PDF ужо змяшчае рэальны тэкст — затым перабудоўвае яго ў рэдагуемы TXT, які можна адкрыць і змяніць у Word, Google Docs або LibreOffice.
Так - калі PDF з' яўляецца сканаваным малюнкам або PDF толькі з малюнкамі, канвэртар запускае OCR, каб распазнаць сімвалы і стварыць рэальны, вылучаны тэкст у TXT. Калі PDF ужо мае лічбавы пласт тэксту, ён прапускае OCR і капіруе тэкст без прамежкаў, што хутчэй і на 100% дакладней.
Для чыстай, высокай раздзяляльнасці сканавання друкаванага тэксту, дакладнасць OCR звычайна складае 98- 99%. Дакладнасць зніжаецца пры сканаваннях з нізкім DPI, накіраваных старонках, рукапісе або незвычайных шрыфтах. Для лепшых вынікаў сканаваць PDF з 300 DPI або больш і трымаць старонкі прама; канвэртар аўтаматычна выпраўляе накіраванасць і здымае шум перад распазнаваннем.
Канвэртар аднаўляе парадак чытання, абзацы і загалоўкі ў TXT і захоўвае простую структуру слупкоў і табліц. Складаныя макеты (журнальныя разгорткі, складаныя формы) спрашчаюцца да чыстай рэдагаванай структуры - прыярытэт надаецца дакладнаму, рэдагаваму тэкст, а не дакладнаму рэдагавання макета.
OCR распазнае больш за 100 моў, уключаючы лацінскую, кирилліцу, грэчаскую, арабскую, іўрыт і CJK (кітайскую/ японскую/ карэйскую) пісьмовыя знакі, і аўтаматычна вызначае мову PDF. Смешаныя моўныя старонкі таксама апрацоўваюцца. Выяўлены тэкст апынецца ў TXT у правільнай пісьмовай форме, гатовы да рэдагавання.
Так - шматстаронкавы PDF (PDF або шматстаронкавы TIFF) апрацоўваецца па старонках і злучаецца ў адзіны непарыўны TXT дакумент са старонкамі ў парадку. Разрывы старонак з PDF захоўваюцца як разрывы раздзелаў у TXT, таму структура застаецца яснай.
Канвэртар выяўляе табліцы з лініямі ў PDF і пераўтварае іх у рэальныя рэдагуемы TXT табліцы, калі гэта магчыма. Безмежавыя або візуальна падразумелыя табліцы цяжэй вызначыць і могуць быць вызначаны як тэкст з табліцамі - праверце і змяніце межы табліцы ў рэдактары пасля пераўтварэння.
Выцягванне тэкставых пластоў (не патрабуецца OCR) адбываецца амаль імгненна. OCR павольней - каля 1- 3 секунд на старонку ў залежнасці ад раздзялення і мовы. Сканаванне 50- старонак PDF звычайна скануе менш за дзве хвіліны; Premium запускае больш паралельна працуючых OCR- працэсараў для вялікіх партый.
Так - загружаныя PDF файлы і раскрыты тэкст апрацоўваюцца ў ізаляваных рабочых і выдаляюцца праз некалькі хвілін. Мы ніколі не чытаем, не захоўваем і не распаўсюджваем змест дакумента. Глядзіце / privacy / для дыялогу захавання.
Памылкі OCR амаль заўсёды звязаны з якасцю крыніц: сканаваныя з нізкім DPI, артэфакты сціску JPEG, слабы або скапіраваны тэкст, пашкоджаныя або дэкаратыўныя шрыфты. Перазагрузіце PDF з 300 DPI у градацыях шэрага, захоўвайце старонкі плоскімі і прамымі, а затым перазагрузіце - дакладнасць распазнавання значна павышаецца з чыстым крыніцай.
Распізнанне друкаванага тэксту працуе надзейна; распізнанне рукапісу значна менш дакладнае і працуе толькі для чыстай, падзеленай друкаванай тэксту, а не курсіў. Для рукапісу PDF чакайце, што вы будзеце чытаць TXT уважліва. Напісаны або друкаваны крыніца матэрыялу, дзе OCR пераўзыходзіць.
Так - мэта пераўтварэння PDF у рэдагуемы TXT заключаецца ў тым, што вынік будзе сапраўдным тэкстам, а не малюнкам: вы можаце шукаць у ім, вылучаць і капіяваць, правяраць правапіс і рэдагаваць яго. Гэтая розніца паміж гэтым і проста праглядаць PDF як малюнак.

PDF

PDF-файлы захоўваюць фарматаванне на ўсіх прыладах і аперацыйных сістэмах, што робіць іх ідэальнымі для сумеснага выкарыстання дакументаў, якія павінны выглядаць аднолькава ўсюды.

TXT

Файлы TXT утрымліваюць толькі звычайны тэкст, які можна прачытаць любым тэкставым рэдактарам на любой платформе.


Ацаніце гэты інструмент
5.0/5 - 0 галасоў
Або перакіньце сюды свае файлы