第12章 图像识别妙用:图书馆捡漏古籍?(1/2)
系统升级带来的图像识别和推荐算法,让林风的“未来AI工作室”潜力大增。但他很快就遇到了一个现实的问题——缺钱。
租用简陋车库、购买二手设备、拉网线已经花光了他那点奖学金和零花钱。想要升级设备、购买服务器(哪怕是最低端的),甚至给未来的产品做推广,都需要资金。
靠父母?他不想再增加家里的负担。靠写小程序卖钱?周期慢,而且容易暴露。
林风将目光投向了新解锁的“图像识别技术(基础)”。尤其是其中的ocR(光学字符识别)功能,让一个大胆的想法在他心中萌生——去“捡漏”!
2008年,信息远不如后世发达,许多有价值的古籍、手稿、旧版书,可能就静静地躺在图书馆的角落或旧书市场的尘埃里,无人识货。如果能利用AI的ocR技术快速扫描、识别、再结合系统数据库里关于未来收藏品价值的信息……岂不是一条快速积累原始资本的捷径?
说干就干!
林风首先需要一个扫描工具。他用仅剩不多的钱,去二手市场淘了一部最便宜的、带摄像头的早期智能手机(虽然功能简陋,但能拍照和运行简单程序)。然后,他熬了一个晚上,利用python和系统提供的接口,编写了一个简单的应用程序:
这个程序可以调用手机摄像头,快速连续拍照,并将图片压缩后,通过极其微弱的网络信号(或者设定为稍后连接wiFi时批量处理)上传到一个他临时租用的、极其隐蔽的最低配网络服务器(用积分在系统商城兑换的短期服务)。服务器上运行着他编写的另一个脚本,调用系统的ocR模块进行文字识别,并与系统数据库中关于珍稀书籍、手稿、作者、版本等信息进行比对。一旦发现潜在目标,系统会立刻向林风的脑海发出提示。
整个过程,在外人看来,他就像是在用手机随便拍着玩。
准备就绪。
周末,林风没有去工作室,而是直奔东海市最大的旧书市场。
这里人声鼎沸,书摊一个挨着一个,从泛黄的线装古籍到八九十年代的连环画、旧杂志,应有尽有,空气中弥漫着旧纸张特有的霉味和墨香。
林风装作随意闲逛的样子,在一个个书摊前流连。他手里看似随意地把玩着那部旧手机,实则摄像头正以极快的速度,悄无声息地“扫描”着那些堆积如山的书籍封面、扉页,甚至是摊主随意摆放的一些信札、手稿。
在他的脑海中,虚拟光屏上,无数的图片信息流如同瀑布般闪过,AI系统正在后台高速运转,进行着ocR识别和数据比对。
【扫描项目:民国旧画报……价值:低。】【扫描项目:《读者》杂志合订本……价值:极低。】【扫描项目:手抄本《红楼梦》……版本:普通,价值:低。】……
一连串的“价值低”提示,并没有让林风气馁。捡漏本就是碰运气的事情,大海捞针,需要耐心。
他在一个看起来毫不起眼的角落书摊前停了下来。摊主是个昏昏欲睡的老大爷,摊位上堆满了各种杂乱的旧书和纸张。
林风的目光扫过一堆发黄的旧信纸,手机摄像头快速掠过。
【嘀——检测到潜在高价值目标!】【类型:手稿。】【初步识别关键词:“鲁迅”、“周树人”、“内山书店”、“版税”……】【正在进行笔迹比对……与已知鲁迅先生中年时期笔迹相似度:85%!】【综合价值评估:高!极有可能为鲁迅先生未公开信件手稿!】
林风的心脏猛地一跳!
本章未完,点击下一页继续阅读。