Google Research近日推出了一项革新的人工智能技术——InkSight系统,该技术能够直接识别并转换手写文字图片中的信息,省去了传统转换方式中的中间环节。
与传统的光学字符识别(OCR)技术相比,InkSight在处理模糊、低光照或背景复杂的手写文本时,展现出更高的识别准确率。这一技术模仿了人类学习阅读的过程,通过不断重写来深入“理解”文字的外观和意义,从而提高了识别的精准度。
实验结果显示,人们在阅读由InkSight生成的文本时,识别准确率高达87%,且其中三分之二的输出与真实手写难以区分。
这项技术对于那些喜欢手写记录的人来说,无疑是一大福音。今后,他们只需拍照上传手写笔记,即可轻松转换为可搜索和编辑的数字文本。即便是字迹难以辨认的潦草手写,InkSight也能精准转换,生成清晰、准确的文本。
InkSight技术在文化遗产保护领域也大有可为。它能够将珍贵的手写文献数字化,为历史研究提供便利,同时也有助于保护和传承那些数字化程度较低的语言和文化。
谷歌并非手写识别AI领域的唯一探索者。亚马逊的Kindle Scribe以及Goodnotes等应用也在该领域取得了显著进展,共同推动着手写识别技术的发展。