ÆÄ¿öÁ¨ AI ±â¹Ý ‘Gen OCR ¼Ö·ç¼Ç’ |
[´º½º·±=ÃÖ½ÂÈ£ ±âÀÚ] ÀΰøÁö´É(AI) DX Àü¹® ±â¾÷(´ëÇ¥ ÀÌÁ¤±Ô) ÆÄ¿öÁ¨Àº Àڻ簡 Ãâ½ÃÇÑ AI ±â¹ÝÀÇ Gen OCR 3.0ÀÌ ½ÇÁ¦ »ê¾÷ ÇöÀå, »ç¹« ¾÷¹«¿¡ °¡Àå ³ôÀº È¿À²¼ºÀ» Á¦°øÇÏ¸ç °í°´µé¿¡°Ô È£ÆòÀ» ¹Þ°í ÀÖ´Ù°í 4ÀÏ ¹àÇû´Ù.
Áö³ÇØ Ãâ½ÃÇÑ ÆÄ¿öÁ¨ÀÇ AI ±â¹Ý Gen OCRÀº ´Ù¾çÇÑ ºñÁ¤Çü À̹ÌÁö ¹®¼¿¡¼ ÇÊ¿ä Á¤º¸¸¦ ÃßÃâÇØ ÀÚµ¿È ¾÷¹«¿¡ ½Å¼ÓÇÏ°Ô ´ëÀÀÇϱâ À§ÇÑ À̹ÌÁö Á¤º¸ ÃßÃâ ¼Ö·ç¼ÇÀÌ´Ù. RPA¿Í Ä÷¡¹ö·¹À̼ÇÀ» °¡Àå Àß ÀÌ·ç´Â ¼Ö·ç¼ÇÀ¸·Î Æò°¡µÈ´Ù.
Gen OCRÀº ¹®¼ ºÐ·ù ó¸® ½Ã°£ ´ÜÃàÀ» À§ÇØ ÇØ´ç ¹®¼ ÀüüÀÇ ºÐ·ù¸¦ ÃÖÀûÈÇÒ ¼ö ÀÖ´Â ¿µ¿ªÀÇ ÃÖ¼Ò ºÎºÐÀ» À̹ÌÁö ºñ±³ ¿µ¿ªÀ¸·Î ÁöÁ¤ÇÏ°í, ÁöÁ¤µÈ ¿µ¿ªÀÇ ´ëÇ¥ ¹®¼¿Í ó¸® ¹®¼ÀÇ À̹ÌÁö¸¦ ºñ±³ÇØ ÀÏÁ¤ À¯»çµµ¸¦ º¸ÀÌ¸é °°Àº ¹®¼·Î OCR ó¸®ÇÑ´Ù. ¶Ç ¾È µÇ´Â °ÍÀº Not Processed·Î ÀçÇнÀ ó¸®ÇÏ´Â µî »õ·Î¿î ¹æ½ÄÀÇ ´ëÇ¥ ¹®¼ ±â¹Ý ±â°è ÇнÀ ±â´ÉÀ» µµÀÔÇØ ´Ù¸¥ Á¦Ç°°ú Â÷º°ÈÇß´Ù.
Gen OCRÀº ÁöÁ¤µÈ ¿µ¿ªÀÇ Æ¯Á¤ StringÀ» Neural String Find ¸ðµ¨À» »ç¿ëÇÏ°í True Keyword, False Keyword¸¦ È°¿ëÇØ ¹®¼ ºÐ·ù¸¦ ÇÑ´Ù(String ºñ±³¸¦ ºü¸£°Ô Çϱâ À§ÇÔ).
ÀÌ·¸°Ô ÇÏ¸é »ç¶÷ÀÌ º¼ ¶§ À¯»çÇÑ ¹®¼°¡ ¿©·¯ ¿øÀÎÀ¸·Î OCRÇÑÅ× ´Ù¸¥ ¹®¼·Î ¿ÀÀνĵǴ ¹®Á¦¸¦ ÃÖ¼ÒÈÇØ ´ë±×·ì ´ÜÀ§·Î ¹À» ¼ö ÀÖ°í, ÀûÀº ¹®¼·®À¸·Îµµ ÇнÀ °¡´ÉÇØ ±¸Çö ÀÌÈÄ ÇнÀ È¿À²¼ºÀÌ Å©°Ô Çâ»óµÈ´Ù.
Áï Áֹεî·ÏÁõ, ¿îÀü¸éÇãÁõÀ̳ª ¿©±ÇÀÌ ÇϳªÀÇ ½ÅºÐÁõ À¯ÇüÀ¸·Î ÅëÇÕÇØ °ü¸®ÇÒ ¼ö ÀÖ´Ù.
ÇнÀÇÑ ¹®¼¸¦ ¹ÙÅÁÀ¸·Î ¹®¼ À¯»çµµ ¹× Å°¿öµå¿¡ µû¸¥ ÀÚµ¿ ¹®¼ ºÐ·ù°¡ °¡´ÉÇØ ½Ì±Û ÇÊµå ´ÜÀ§ ¹× Å×À̺í ÇüÅÂÀÇ ¶óÀκ° Á¤º¸ ÃßÃâÀ» ¸ðµÎ ÇÒ ¼ö ÀÖÀ¸¸ç, Æǵ¶ÇÑ °á°ú´Â RPA 󸮸¦ À§ÇÑ ÆÄÀÏ ÇüÅÂ¿Í ³»ÀçÇÑ API¸¦ ÅëÇØ ´Ù¸¥ ½Ã½ºÅÛ°ú Á÷Á¢ ¿¬°è°¡ °¡´ÉÇÏ´Ù.
¶Ç º´·Ä ó¸® ¹Ìµé¿þ¾î(Middleware) ¿£ÁøÀ» ÅëÇØ ´ë¿ë·® ¹®¼ÀÇ ºü¸¥ OCR 󸮸¦ µ½°í, ÀÚµ¿ ÇнÀ ¶óº§ ±â´ÉÀ¸·Î »ç¿ëÀÚÀÇ ¹®¼ Training ³ë·ÂÀ» ÃÖ¼ÒÈÇÒ ¼ö ÀÖ´Ù. Noise°¡ ÀÖ´Â ¹®ÀÚ À̹ÌÁö Á¤º¸¿¡ ´ëÇؼµµ Deep LearningÀ» ÅëÇØ Á¤È®µµ¸¦ ³ôÀÏ ¼ö ÀÖ´Â ±â´ÉÀÌ ³»Àç, Çʱâü ÇüÅÂÀÇ À̸§À̳ª ¼ýÀÚ µîÀ» °è¼Ó ÇнÀ½ÃÅ°¸é ½Ãų¼ö·Ï Á¤È®µµ°¡ ³ô¾ÆÁöµµ·Ï ¼³°èµÆ´Ù.
¾Æ¿ï·¯ GPU ¼¹ö ¹æ½ÄÀÇ À¥ ½Ã½ºÅÛÀ¸·Î °³¹ßµÅ Çö¾÷ ´ã´çÀÚº° »ç¿ë °á°ú Á¢±ÙÀ̳ª º¸¾È ¹× À¯Áö º¸¼ö°¡ ½±´Ù.
FAX µî ÀúÇ°Áú ¹®¼ÀÇ ÀÚµ¿ Á¤À§Ä¡, Âî±×·¯Áü º¸Á¤, ÀÚµ¿ ³ëÀÌÁî Á¦°Å¸¦ ÅëÇÑ OCR ¿£ÁøÀÇ ÀνķüÀ» ³ôÀÏ ¼ö ÀÖ´Â ÀÚµ¿ Àüó¸® ±â´É°ú AI ¼·ù ºÐ·ù(Documents Classifier) ±â´ÉÀ» žÀçÇØ ´ë·® ÆäÀÌÁö ¹®¼ °¡¿îµ¥ ÇÊ¿ä·ºÒÇÊ¿ä ÆäÀÌÁö¸¦ ±â°è ÇнÀÀ» ÅëÇØ ÇÊ¿äÇÑ ÆäÀÌÁö¿¡¼¸¸ Á¤º¸¸¦ ÃßÃâÇϵµ·Ï ÇÏ´Â Â÷º°ÈÇÑ Áö´ÉÀ» °®Ãè´Ù. ÀÌ¿¡ Àüü ¹®¼¸¦ ÀÐ¾î µéÀÌ´Â ±âÁ¸ OCRÀÇ ºñÈ¿À²¼ºÀ» °³¼±Çß´Ù.
¶Ç ±âÁ¸ OCRÀÇ Full Text ó¸® °á°ú¸¦ ±â¹ÝÀ¸·Î Text Analysis¸¦ ÅëÇØ ÇÊ¿äÇÑ °ª¸¸ ÃßÃâÇØ¾ß ÇÏ´Â SI¼º °³¹ß ºÎ´ãÀ» Å©°Ô ÁÙÀÏ ¼ö ÀÖ°Ô µÆ´Ù.
ƯÈ÷ ¸ÖƼ OCR ¿£ÁøÀ¸·Î ±â°èÀû ±³Â÷ °ËÁõÀ» ÇÒ ¼ö ÀÖ¾î °á°ú 󸮿¡ ´ëÇÑ »ç¶÷ÀÇ ´« °ËÁõÀ» 90% ÀÌ»ó Àý°¨ÇÒ ¼ö Àִ ƯÀåÁ¡µµ ÀÖ´Ù. ¹®¼ À¯Çü ¶Ç´Â ¹®¼ Çʵ庰·Î °ªÀ» Àß Àд OCR ¿£ÁøÀ» ÁöÁ¤ÇÒ ¼ö ÀÖ¾î ÇϳªÀÇ OCR ¿£Áø¿¡ Á¾¼ÓµÇ´Â ¹®Á¦µµ ÇØ°áÇÒ ¼ö ÀÖ´Ù.
ÃÖ±Ù Á¦Á¶ ¾÷ü A ±â¾÷°ú ±ÝÀ¶±Ç B ±â¾÷Àº ±âÁ¸ OCRÀÌ ÀνÄÇÏÁö ¸øÇÏ´Â °í°´ Æ¯È ¹®¼ ¹× ¹®¼ ¿µ¿ª¿¡ ´ëÇØ ÆÄ¿öÁ¨ÀÇ Gen OCRÀÌ ³ôÀº ÀνķüÀ» º¸¿©ÁÖÀÚ “ÀÚ»çÀÇ ¾÷¹« ÀÚµ¿È¿¡ ´ëÇÑ ±â¼úÀûÀÎ °í¹ÎÀ» ÇØ°áÇØÁá´Ù”¸ç ÆÄ¿öÁ¨ÀÇ ³ë°í¿¡ °¨»ç¸¦ ³ªÅ¸³»±âµµ Çß´Ù.
ÆÄ¿öÁ¨ ÀÌÁ¤±Ô ´ëÇ¥ÀÌ»ç´Â “ÃÖ±Ù ÀÚ»ç Gen OCR¿¡ ´ëÇÑ °í°´µéÀÇ ½Å·Ú¿Í ÀÀ¿ø¿¡ ±íÀº °¨»ç¸¦ µå¸°´Ù"¸ç “OCRÀº Á¦Á¶ ÇöÀåÀÇ ¹®¼, ÇϵåÄ«Çdzª Æѽº·Î ¿Â ¹®¼, ÀÏ¹Ý OCR·Î ÀνÄÇϱ⠾î·Á¿î »óÅÂÀÇ ¹®¼, ¸ð¹ÙÀÏ Ä«¸Þ¶ó·Î ÂïÀº ¹®¼ µîÀ» Á¤È®È÷ ÀνÄÇØ RPA¸¦ ÅëÇØ ÀÚµ¿ ¾÷¹« ȯ°æÀ» ±¸Ãà, ±âÁ¸ OCR ¼Ö·ç¼Çº¸´Ù ¿ùµîÇÑ ¾÷¹« È¿À²À» Á¦°øÇØ ½ÇÁ¦ ÇöÀå¿¡ ¸Â´Â OCRÀ» ±¸ÃàÇØ °í°´ÀÇ µðÁöÅÐ Àüȯ ±¸Çö¿¡ ¾ÕÀå¼ ³ª°¡°Ú´Ù”°í ¸»Çß´Ù.
ÃÖ½ÂÈ£ ±âÀÚ news114@newsrun.co.kr
ÃÖ½ÂÈ£ ±âÀÚ news114@newsrun.co.kr
<ÀúÀÛ±ÇÀÚ © ´º½º·±, ¹«´Ü ÀüÀç ¹× Àç¹èÆ÷ ±ÝÁö>