පී.ඩී.එෆ් ගොනුවක පෙළ අන්තර්ජාලය හරහා හඳුනා ගන්න

Pin
Send
Share
Send


නිතිපතා පිටපත් කිරීම මගින් PDF ගොනුවකින් පෙළ උකහා ගැනීම සැමවිටම කළ නොහැක්කකි. බොහෝ විට එවැනි ලේඛනවල පිටු ඒවායේ කඩදාසි අනුවාදවල පරිලෝකනය කර ඇත. එවැනි ලිපිගොනු සම්පුර්ණයෙන්ම සංස්කරණය කළ හැකි පෙළ දත්ත බවට පරිවර්තනය කිරීම සඳහා, දෘශ්‍ය අක්ෂර හඳුනාගැනීම (OCR) ශ්‍රිතය සහිත විශේෂ වැඩසටහන් භාවිතා කරනු ලැබේ.

එවැනි තීරණ ක්රියාත්මක කිරීම ඉතා අපහසු වන අතර එබැවින් විශාල මුදලක් වැය වේ. ඔබට නිතිපතා පී.ඩී.එෆ් වෙතින් පෙළ හඳුනා ගැනීමට අවශ්‍ය නම්, සුදුසු වැඩසටහනක් මිලට ගැනීම සුදුසුය. දුර්ලභ අවස්ථාවන් සඳහා, සමාන කාර්යයන් සහිත පවතින මාර්ගගත සේවාවන්ගෙන් එකක් භාවිතා කිරීම වඩාත් තාර්කික වනු ඇත.

පී.ඩී.එෆ්. මාර්ගගතව පෙළ හඳුනා ගන්නේ කෙසේද?

ඇත්ත වශයෙන්ම, සම්පූර්ණ ඩෙස්ක්ටොප් විසඳුම් සමඟ සැසඳීමේදී OCR මාර්ගගත සේවා විශේෂාංග පරාසය වඩා සීමිතය. එහෙත් ඔබට එවැනි සම්පත් සමඟ නොමිලේ හෝ නාමික ගාස්තුවකට වැඩ කළ හැකිය. ප්රධාන දෙය නම්, ඔවුන්ගේ ප්රධාන කර්තව්‍යය වන පෙළ හඳුනා ගැනීමත් සමඟ අනුරූප වෙබ් යෙදුම් ද සාර්ථකව මුහුණ දීමයි.

ක්රමය 1: ABBYY FineReader ඔන්ලයින්

සේවා සංවර්ධන සමාගම යනු දෘශ්‍ය ලේඛන හඳුනාගැනීමේ ක්ෂේත්‍රයේ ප්‍රමුඛයා වේ. වින්ඩෝස් සහ මැක් සඳහා වන ABBYY FineReader යනු PDF ලෙස පෙළ බවට පරිවර්තනය කිරීම සහ එය සමඟ තවදුරටත් වැඩ කිරීම සඳහා ප්‍රබල විසඳුමකි.

වැඩසටහනේ වෙබ් පාදක ඇනලොග්, ඇත්ත වශයෙන්ම, ක්‍රියාකාරීත්වයට වඩා පහත් ය. එසේ වුවද, භාෂා 190 කට වඩා වැඩි ගණනක ස්කෑන් හා ඡායාරූප වලින් පෙළ හඳුනා ගැනීමට සේවාවට හැකිය. පී.ඩී.එෆ් ගොනු වර්ඩ්, එක්සෙල් යනාදිය බවට පරිවර්තනය කරන්න.

ABBYY FineReader මාර්ගගත මාර්ගගත සේවාව

  1. ඔබ මෙවලම සමඟ වැඩ කිරීමට පෙර, වෙබ් අඩවියේ ගිණුමක් සාදන්න හෝ ඔබේ ෆේස්බුක්, ගූගල් හෝ මයික්‍රොසොෆ්ට් ගිණුම භාවිතා කර ලොග් වන්න.

    බලය පැවරීමේ කවුළුව වෙත යාමට, බොත්තම ක්ලික් කරන්න "ඇතුල්වීම" ඉහළ මෙනු තීරුවේ.
  2. පුරනය වීමෙන් පසු, බොත්තම භාවිතයෙන් අපේක්ෂිත PDF- ලේඛනය FineReader වෙත ආයාත කරන්න “ගොනු උඩුගත කරන්න”.

    ඉන්පසු ක්ලික් කරන්න "පිටු අංක තෝරන්න" පෙළ හඳුනා ගැනීම සඳහා අපේක්ෂිත පරතරය නියම කරන්න.
  3. ඊළඟට, ලේඛනයේ ඇති භාෂා, එහි ප්‍රති file ලයක් ලෙස ඇති ගොනුවේ ආකෘතිය තෝරා බොත්තම ක්ලික් කරන්න “හඳුනාගන්න”.
  4. සැකසීමෙන් පසු, කාලසීමාව ලේඛනයේ පරිමාව මත සම්පූර්ණයෙන්ම රඳා පවතී, ඔබට නිමි ගොනුව පෙළ දත්ත සමඟ බාගත කර එහි නම ක්ලික් කිරීමෙන් එය බාගත කළ හැකිය.

    නැතහොත්, පවතින වලාකුළු සේවාවකට එය අපනයනය කරන්න.

පින්තූර සහ PDF ලිපිගොනු වල වඩාත් නිවැරදි පෙළ හඳුනාගැනීමේ ඇල්ගොරිතම මගින් සේවාව කැපී පෙනේ. එහෙත්, අවාසනාවකට මෙන්, එහි නොමිලේ භාවිතය මසකට සැකසූ පිටු පහකට සීමා වේ. වඩා විශාල ලේඛන සමඟ වැඩ කිරීමට, ඔබට වාර්ෂික දායකත්වයක් මිලදී ගැනීමට සිදුවේ.

කෙසේ වෙතත්, OCR අවශ්‍ය වන්නේ කලාතුරකිනි, කුඩා PDF ලිපිගොනු වලින් පෙළ උපුටා ගැනීම සඳහා ABBYY FineReader Online හොඳ විකල්පයකි.

ක්රමය 2: නොමිලේ මාර්ගගත OCR

පෙළ ඩිජිටල්කරණය සඳහා සරල හා පහසු සේවාවක්. ලියාපදිංචි කිරීමකින් තොරව, සම්පත ඔබට පැයකට සම්පූර්ණ PDF පිටු 15 ක් හඳුනා ගැනීමට ඉඩ සලසයි. නොමිලේ මාර්ගගත OCR භාෂා 46 කින් යුත් ලේඛන සමඟ සම්පුර්ණයෙන්ම ක්‍රියා කරන අතර අවසරයකින් තොරව පෙළ අපනයන ආකෘති තුනකට සහාය දක්වයි - DOCX, XLSX සහ TXT.

ලියාපදිංචි කිරීමේදී, පරිශීලකයාට බහු පිටු ලේඛන සැකසීමට අවස්ථාව ලැබේ, නමුත් මෙම පිටු වලම නොමිලේ අංකය ඒකක 50 කට සීමා වේ.

නොමිලේ මාර්ගගත OCR මාර්ගගත සේවාව

  1. PDF හි ඇති පා “ය“ ආගන්තුකයෙකු ”ලෙස හඳුනා ගැනීමට, සම්පත පිළිබඳ අවසරයකින් තොරව, වෙබ් අඩවියේ ප්‍රධාන පිටුවේ සුදුසු පෝරමය භාවිතා කරන්න.

    බොත්තම භාවිතයෙන් අපේක්ෂිත ලේඛනය තෝරන්න ගොනුව, පෙළෙහි ප්‍රධාන භාෂාව, ප්‍රතිදාන ආකෘතිය සඳහන් කරන්න, ඉන්පසු ගොනුව පූරණය වන තෙක් බලා ක්ලික් කරන්න පරිවර්තනය කරන්න.
  2. ඩිජිටල්කරණ ක්‍රියාවලිය අවසානයේ, ක්ලික් කරන්න "ප්‍රතිදාන ගොනුව බාගන්න" පරිගණකයේ පෙළ සමඟ නිමි ලේඛනය සුරැකීමට.

බලයලත් පරිශීලකයින් සඳහා, ක්‍රියාවන්ගේ අනුක්‍රමය තරමක් වෙනස් වේ.

  1. බොත්තම භාවිතා කරන්න "ලියාපදිංචිය" හෝ "ඇතුල්වීම" ඉහළ මෙනු තීරුව තුළ, ඒ අනුව, නොමිලේ මාර්ගගත OCR ගිණුමක් නිර්මාණය කිරීම හෝ එයට ලොග් වීම.
  2. පිළිගැනීමේ පුවරුවේ අවසරයෙන් පසුව, යතුර ඔබාගෙන සිටින්න සීටීආර්එල්, සපයා ඇති ලැයිස්තුවෙන් ප්‍රභව ලේඛනයේ භාෂා දෙකක් දක්වා තෝරන්න.
  3. PDF වෙතින් පෙළ උපුටා ගැනීම සඳහා තවත් විකල්ප සඳහන් කර ක්ලික් කරන්න ගොනුව තෝරන්න සේවාවට ලේඛනයක් උඩුගත කිරීමට.

    හඳුනා ගැනීම ආරම්භ කිරීමට ක්ලික් කරන්න පරිවර්තනය කරන්න.
  4. ලේඛනය සැකසීමේ අවසානයේ, අදාළ තීරුවේ ප්‍රතිදාන ගොනුවේ නම සහිත සබැඳිය ක්ලික් කරන්න.

    හඳුනාගැනීමේ ප්‍රති result ලය වහාම ඔබේ පරිගණකයේ මතකයේ සුරකිනු ඇත.

ඔබට කුඩා PDF ලේඛනයකින් පෙළ උකහා ගැනීමට අවශ්‍ය නම්, ඔබට ඉහත මෙවලම භාවිතා කිරීම ආරක්ෂිතව කළ හැකිය. විශාල ලිපිගොනු සමඟ වැඩ කිරීමට, ඔබට නොමිලේ මාර්ගගත OCR හි අමතර අක්ෂර මිලදී ගැනීමට හෝ වෙනත් විසඳුමක් භාවිතා කිරීමට සිදුවේ.

ක්රමය 3: නිව් ඕසීආර්

DjVu සහ PDF වැනි ඕනෑම ග්‍රැෆික් හා ඉලෙක්ට්‍රොනික ලේඛනවලින් පා text උපුටා ගැනීමට ඔබට ඉඩ සලසන සම්පූර්ණයෙන්ම නොමිලේ OCR සේවාව. සම්පත විසින් පිළිගත් ලිපිගොනු ප්‍රමාණය හා ගණන මත සීමාවන් පනවන්නේ නැත, ලියාපදිංචිය අවශ්‍ය නොවන අතර පුළුල් පරාසයක අදාළ කාර්යයන් ඉදිරිපත් කරයි.

NewOCR භාෂා 106 කට සහය දක්වන අතර අඩු ගුණාත්මක ලේඛන පරිලෝකනය පවා නිවැරදිව සැකසිය හැක. ගොනු පිටුවේ පෙළ හඳුනා ගැනීම සඳහා ප්‍රදේශය අතින් තෝරා ගත හැකිය.

NewOCR මාර්ගගත සේවාව

  1. එබැවින්, අනවශ්‍ය ක්‍රියා සිදු කිරීමකින් තොරව ඔබට වහාම සම්පතක් සමඟ වැඩ කිරීම ආරම්භ කළ හැකිය.

    ප්‍රධාන පිටුවේම වෙබ් අඩවියට ලේඛනයක් ආයාත කිරීම සඳහා පෝරමයක් ඇත. NewOCR වෙත ගොනුවක් උඩුගත කිරීමට, බොත්තම භාවිතා කරන්න "ගොනුව තෝරන්න" කොටසේ "ඔබේ ගොනුව තෝරන්න". ඉන්පසු ක්ෂේත්රයේ "පිළිගැනීමේ භාෂාව (ය)" ප්‍රභව ලේඛනයේ භාෂා එකක් හෝ කිහිපයක් සඳහන් කරන්න, ඉන්පසු ක්ලික් කරන්න "උඩුගත කරන්න + OCR".
  2. ඔබ කැමති හඳුනාගැනීමේ සැකසුම් සකසා, ඔබට පෙළ උකහා ගැනීමට අවශ්‍ය පිටුව තෝරන්න සහ බොත්තම ක්ලික් කරන්න OCR.
  3. පිටුව ටිකක් පහළට අනුචලනය කර බොත්තම සොයා ගන්න "බාගන්න".

    එය මත ක්ලික් කර පතන ලැයිස්තුවේ බාගත කිරීම සඳහා අවශ්‍ය ලේඛන ආකෘතිය තෝරන්න. ඊට පසු, උපුටා ගත් පෙළ සහිත නිමි ගොනුව ඔබේ පරිගණකයට බාගත කෙරේ.

මෙවලම පහසු වන අතර තරමක් උසස් තත්ත්වයේ සියලුම අක්ෂර හඳුනා ගනී. කෙසේ වෙතත්, ආනයනය කරන ලද PDF ලේඛනයේ එක් එක් පිටුව සැකසීම ස්වාධීනව ආරම්භ කළ යුතු අතර එය වෙනම ගොනුවක දර්ශනය වේ. ඇත්ත වශයෙන්ම, හඳුනාගැනීමේ ප්‍රති results ල ක්ලිප් පුවරුවට පිටපත් කර ඒවා අනෙක් අය සමඟ ඒකාබද්ධ කළ හැකිය.

එසේ වුවද, ඉහත විස්තර කර ඇති සූක්ෂ්මතාවය අනුව, නිව් ඕඕසීආර් භාවිතයෙන් විශාල පෙළ ප්‍රමාණයක් උපුටා ගැනීම ඉතා අපහසුය. කුඩා ලිපිගොනු සමඟ, සේවාව පිපිරීමක් සමඟ කටයුතු කරයි.

ක්රමය 4: OCR.Space

පෙළ ඩිජිටල් කිරීම සඳහා සරල හා තේරුම්ගත හැකි සම්පතක් වන මෙය PDF ලේඛන හඳුනා ගැනීමට සහ ප්‍රති result ලය TXT ගොනුවකට ප්‍රතිදානය කිරීමට ඉඩ දෙයි. පිටු ගණනට සීමාවන් සපයා නැත. එකම සීමාව වන්නේ ආදාන ලේඛනයේ ප්‍රමාණය මෙගාබයිට් 5 නොඉක්මවිය යුතුය.

OCR.Space මාර්ගගත සේවාව

  1. මෙවලම සමඟ වැඩ කිරීමට ලියාපදිංචි වීම අවශ්ය නොවේ.

    ඉහත සබැඳිය අනුගමනය කර බොත්තම භාවිතයෙන් පරිගණකයෙන් PDF ලේඛනය වෙබ් අඩවියට උඩුගත කරන්න "ගොනුව තෝරන්න" හෝ ජාලයෙන් - යොමු දැක්වීමෙන්.
  2. පතන ලැයිස්තුවේ "OCR භාෂාව තෝරන්න" ආනයනය කළ ලේඛනයේ භාෂාව තෝරන්න.

    ඉන්පසු බොත්තම ක්ලික් කිරීමෙන් පෙළ හඳුනාගැනීමේ ක්‍රියාවලිය ආරම්භ කරන්න "OCR ආරම්භ කරන්න!".
  3. ගොනු සැකසුම් අවසානයේ, ක්ෂේත්‍රයේ ප්‍රති result ලය කියවන්න OCR'ed ප්‍රති ult ලය ක්ලික් කරන්න "බාගන්න"නිමි TXT ලේඛනය බාගත කිරීමට.

ඔබට PDF එකෙන් පෙළ උකහා ගැනීමට අවශ්‍ය නම් සහ ඒ සමඟම එහි අවසාන හැඩතල ගැන්වීම කිසිසේත්ම වැදගත් නොවේ නම්, OCR.Space හොඳ තේරීමකි. එකම දෙය නම් ලේඛනය “ඒකභාෂා” විය යුතු බැවින් එකවර භාෂා දෙකක් හෝ වැඩි ගණනක් පිළිගැනීම සේවාව සඳහා ලබා නොදේ.

මෙයද බලන්න: FineReader හි නිදහස් ප්‍රතිසම

ලිපියේ ඉදිරිපත් කර ඇති මාර්ගගත මෙවලම් තක්සේරු කරමින්, ABBYY හි FineReader ඔන්ලයින් OCR ක්‍රියාකාරිත්වය වඩාත් නිවැරදිව හා කාර්යක්ෂමව හසුරුවන බව සැලකිල්ලට ගත යුතුය. පෙළ හඳුනාගැනීමේ උපරිම නිරවද්‍යතාවය ඔබට වැදගත් නම්, මෙම විකල්පය විශේෂයෙන් සලකා බැලීම වඩාත් සුදුසුය. නමුත් බොහෝ දුරට, ඔබට ඒ සඳහා ගෙවීමට සිදුවනු ඇත.

ඔබට කුඩා ලියකියවිලි ඩිජිටල්කරණය කිරීමට අවශ්‍ය නම් සහ සේවයේ ඇති වැරදි ස්වාධීනව නිවැරදි කිරීමට ඔබ සූදානම් නම්, NewOCR, OCR.Space හෝ නොමිලේ මාර්ගගත OCR භාවිතා කිරීම සුදුසුය.

Pin
Send
Share
Send