Google Book Search现在允许你查看公共领域图书的实际文字而不仅仅是扫描图像。当你使用Google Book Search浏览公关领域图书时,你可以点击侧边栏上的"只阅读文字"链接,页面会自动转换为只包含文字的页面(如图)。这同样意味着你可以对这些文字进行复制等操作。不过据Official Google Blog上的说法,开放这一功能似乎是为了帮助视障人士通过自适应技术(如:语音输入、屏幕阅读器和盲文显示器等)来进行阅读,所以开放纯文字版本来供这些技术读取文本以及排除图片等干扰阅读的元素。
不过奇怪的是Google不愿意像许多其它站点(但Gutenberg计划的搜索功能很差)那样开放这些书籍的文本文件或HTML文件的下载,至今仍然只提供了PDF格式的下载。此外Google也不能十分便捷地找到公共领域的书籍:并不是所有公关领域的书籍都可以全书浏览的(via GOS)。另外从这个服务也可以看出前段时间Google如此热衷开源OCR的原因了,看来以后Official Google Blog的一些前瞻性文章可以作更多的猜测了......
很无奈的一件事,这些拥有书籍版权的传统书籍出版商等人士仍然不愿意接受Google对书籍进行数字化的计划,不仅不愿与Google合作还千方百计地阻挠Google的计划的进行。但每个时代都总是会有这种贪婪的守旧者的存在,这些人永远会无视历史发展的必然趋势,成为迈向新时代的阻力,Google索引全世界信息的宏愿因为有这些人的存在,而要花费时间来进行调停等工作实在令人感到十分无奈和讽刺。
这次Google Book Search改进的另一个地方就是减少了AJAX技术的使用,这有助于Google Book Search能更好地工作在旧的浏览器和移动设备上(IwfWcf:尽管我能从中体会到一点讽刺和无奈的意味)。
没有评论:
发表评论