Libreng plano: 1 conversion / oras, 1 file sa isang oras
Pumunta sa walang limitasyong →

I-Transform PDF sa TXT

I-Transform Ang Iyong PDF sa TXT mga dokumento na may kadalian

Piliin ang iyong mga file

*Nabura ang mga file pagkatapos ng 24 oras

Mag-convert ng hanggang 1 GB na file nang libre, maaaring mag-convert ang mga Pro user ng hanggang 100 GB na file; Mag-sign up ngayon

Nag-a-upload

0%

Paano i-convert PDF sa TXT

Hakbang 1: I-upload ang iyong PDF mga file gamit ang button sa itaas o sa pamamagitan ng drag and drop.

Hakbang 2: I-click ang button na 'I-convert' para simulan ang conversion.

Hakbang 3: I-download ang iyong na-convert na TXT mga file


PDF sa TXT Transpormasyon FAQ

Paano ko i-convert ang PDF sa isang e-edit na TXT dokumento?
+
Upload the PDF and the converter extracts its text — running OCR (optical character recognition) when the PDF is a scan or image, or pulling the text layer directly when the PDF already contains real text — then rebuilds it as an editable TXT you can open and change in Word, Google Docs, or LibreOffice.
Oo — kapag ang PDF ay isang na-scan na imahe o isang imahe-lamang PDF, ang converter ay tumatakbo OCR upang makilala ang mga character at gumawa ng tunay, napili teksto sa TXT. Kapag ang PDF ay may isang digital na layer ng teksto, ito ay tumatalon OCR at kopyahin ang teksto nang direkta, na kung saan ay mas mabilis at 100% tumpak.
Para sa malinis, mataas na resolution scan ng naka-print na teksto, OCR katumpakan ay karaniwang 98-99% +. Katumpakan drop sa low-DPI scan, naka-angkla pahina, pagsulat, o hindi pangkaraniwang mga font. Para sa pinakamahusay na mga resulta scan ang PDF sa 300 DPI o mas mataas at panatilihin ang mga pahina tuwid; ang converter auto-deskews at de-noise bago pagkilala.
Ang converter ay bumubuo ng mga bagong pagbasa ng order, mga talata, at mga pamagat sa TXT, at pinapanatili ang simpleng haligi at talahanayan istraktura. Mabigat na dinisenyo layout (magazine spreads, kumplikadong mga form) ay pinasimple sa isang malinis na editable daloy - ang prayoridad ay tumpak, editable teksto sa ibabaw ng pixel-perfect layout pagpaparami.
OCR kinikilala 100 + wika kabilang ang Latin, Cyrillic, Griyego, Arabic, Hebreo, at CJK (Tsino / Hapon / Koreano) script, at auto-detects ang wika ng PDF. Mixed-wika pahina ay hinawakan din. Ang kinikilalang teksto lupain sa TXT sa tamang script, handa na upang i-edit.
Oo — isang multi-page PDF (PDF o multi-page TIFF) ay naproseso pahina sa pamamagitan ng pahina at pinagsama sa isang solong patuloy na TXT dokumento sa mga pahina sa pagkakasunud-sunod. Page breaks mula sa PDF ay pinananatili bilang seksyon breaks sa TXT kaya ang istraktura ay nananatiling malinaw.
Ang converter na nakikita ang ruled talahanayan sa PDF at reconstructs ang mga ito bilang tunay na editable TXT talahanayan kung saan maaari. Borderless o visually-implied talahanayan ay mas mahirap na matukoy at maaaring dumating sa pamamagitan ng bilang tab-aligned teksto - suriin at ayusin ang mga hangganan ng talahanayan sa iyong editor pagkatapos ng conversion.
OCR ay mas mabagal - humigit-kumulang 1-3 segundo bawat pahina depende sa resolution at wika. Ang isang 50-page scanned PDF karaniwang nagtatapos sa ilalim ng dalawang minuto; Premium tumatakbo ng higit pang mga parallel OCR manggagawa para sa malaking batches.
Oo — nai-upload PDF file at ang kinikilalang teksto ay naproseso sa mga hiwalay na mga manggagawa at tinanggal sa loob ng ilang minuto. Hindi namin basahin, mag-imbak, o ibahagi ang mga nilalaman ng dokumento. Tingnan ang /privacy/ para sa window ng pag-iingat.
OCR error halos palaging trace sa source kalidad: mababang-DPI scans, JPEG compression artifacts, madilim o photocopied teksto, nakatiklop, o dekorasyon font. Re-scan ang PDF sa 300 DPI sa grayscale, panatilihin ang mga pahina flat at tuwid, pagkatapos ay muling patakbuhin - pagkilala katumpakan ay nagpapabuti dramatically sa isang malinis na pinagmulan.
Printed text kinikilala maaasahan; handwriting pagkilala ay malayo mas mababa tumpak at gumagana lamang para sa malinis, hiwalay na print-style ng pagsulat, hindi cursive. Para sa handwritten PDF, asahan na proofread ang TXT malapit. Typed o printed source materyal ay kung saan OCR excels.
Oo — ang buong punto ng conversion PDF sa isang editable TXT ay na ang output ay tunay na teksto, hindi isang imahe: maaari mong hanapin ito, piliin at kopyahin ito, spell-check ito, at i-edit ito nang libre. Na ang pagkakaiba sa pagitan ng ito at lamang ang pagtingin sa PDF bilang isang larawan.

PDF

Ang mga file na PDF ay nag-iimbak ng pag-format sa lahat ng mga device at operating system, na ginagawang perpekto ang mga ito para sa pagbabahagi ng mga file na kailangang magkapareho sa lahat ng dako.

TXT

Ang mga file na TXT ay naglalaman lamang ng karaniwang teksto, na mababasa ng bawat editor ng teksto sa anumang platform.


I-rate ang tool na ito
5.0/5 - 0 mga boto
O kaya naman ay ilagay ang iyong mga file dito