“蓝海”信息自收集系统


Tags:云计算、智能手机、NGN、Android、图像处理、文字识别、语义分析、搜索引擎、全文检索

  在当今社会生活中,网络已经成为人们生活中不可分割的一部分,人们通过网络获取各类信息。随着下一代网络技术(NGN)和智能手机(终端等)技术的发展,人们与网络的关系将更加密切,人们通过智能手机(终端等)与网络无时无刻不连接在一起,但面对浩如烟海的网络资讯(文字、图像、视音频等),如何才能更简便、快速、准确、有效地获取信息呢?抑或有什么办法能自动获取有效的信息吗?这些都成为了让很多人困惑的问题,同时,解决这些问题无疑会是非常有意义的事情,尤其是对那些不熟悉计算机和网络的人,如儿童、学生、老人等。请看以下应用场景:

  应用场景一

  一位旅游者在旅游指南上了解 “西班牙斗牛” 方面的知识,需要获取与西班牙有关的背景资料和信息。为此,他可以用手机对旅游指南中相应的页面文字进行拍照,然后,利用拍摄的图像从网络上自动收集相关的资料和信息,包括新闻、背景介绍、视频等,并在手机上阅读或观看。

  应用场景二

  一个人在上班途中的地铁上,看到报纸上比较感兴趣的文章,想要了解更多的相关资料。他用手机对文章的标题或正文感兴趣的地方进行拍照,然后,利用拍摄的图像从网络上自动获取相关的资料和信息。

  以上这些应用场景听上去是否有些 “天方夜谭”?当你使用赛星的 “蓝海” 信息自收集系统及其云计算应用和服务时,这些不可能都会变成现实。

  赛星 “蓝海” 信息自收集系统就是这样一款帮助人们随时随地、方便地获取信息的高技术产品,人们需要做的只是对感兴趣的文字内容(如书、报纸、杂志、公告等)拍照即可。该产品汇集了当今世界上各个领域最先进的技术,包括:飞速发展的智能手机技术提供了拍照和图像预处理的能力,强大的新一代网络技术(NGN)保证了数据传输的高效、安全和可靠,而云计算技术为分布式处理和服务提供了最佳的基础平台,在此基础上,采用独特的图像处理和自然语言处理技术进行文字和关键词的识别,再通过先进的DBMS技术和搜索引擎技术获取相关的资料和信息,等等。
 

  以下是赛星 “蓝海” 信息自收集系统云计算应用的系统框架图:

 
  系统客户端运行在智能手机(终端)之上,主要功能包括:

  • Image/Video Capture(图像获取)
    此功能用来获取用户对感兴趣的文字拍摄的视频和图像序列(多幅图像),如上述场景中用户用手机对旅游指南或报纸内容的拍照。
  • Image Selection(图像选择)
    由于用户拍照时光线、环境和手的抖动等因素的影响,导致图像质量的下降,此功能可以对图像质量进行评估以选取质量较优的图像,同时还可以对图像进行简单的预处理,以便于服务端对图像进行深度处理。
  • Hyper-Text Viewer(信息查看)
    类似浏览器功能,可以对服务端获取的文字、图像等非流媒体格式的信息进行浏览和阅读。
  • Media Player
    可以对服务端获取的视频、音频等流媒体格式的信息进行播放。

 
  系统服务端运行在云计算平台之上,通过网络为所有用户提供处理和服务,主要功能包括:

  • Online Recognition(文字识别)
    用来对用户获取的图像进行深度处理,采用特殊的图像处理和识别技术对图像中的文字进行识别。
  • Semantic Analysis(语义分析)
    对上述图像中识别的文字通过自然语言处理技术进行语义分析,确定文字含义并自动提取关键词。
  • Data Retrieval(数据检索)
    根据上述功能获取的查询关键词,利用搜索引擎接口技术从各类搜索引擎(如 Google、Baidu、Yahoo 等),或从 DBMS 系统中获取相关的信息和数据,查询和检索的数据还会以缓存(Cache)的方式保存在 DBMS 系统中,以便提高查询和检索的效率和速度。
  • Hyper-Media Annotation(超媒体批注)
    对所有检索到的信息(文字、图像、视频、音频等各类格式的信息)进行综合和分析,生成用户易于使用的前导页面,同时根据信息的关联性、有效性、与关键词的匹配度等因素对所有检索结果进行评估和排序,方便用户获得最有用的信息。
  • Web Services
    通过此功能,用户可以在手机上查看和阅读服务端收集到的文字、图像等非流媒体格式的信息。
  • Media Streaming
    通过此功能,用户可以在手机上观看服务端收集到的视频、音频等流媒体格式的信息。

 

  赛星 “蓝海” 信息自收集系统及其云计算应用的特点如下:
 
   ■ 只需用手机拍下对书(或报纸、杂志等其它平面媒体)中感兴趣的部分,就能从手机上阅读与该部分相关的数字内容,可以从中轻松地获得新知识

   ■ 手无需接触书籍(或报纸、杂志等其它平面媒体),也无需记载二维码,更无需手工输入任何附加信息等

   ■ 只需在采用 Android 系统的智能手机(终端等)上安装客户端应用软件就能使用

   ■ 采用了即使是低画质图像(抖动、阴影等)也可高精度选定识别的技术,因此即使是在拍照条件较差的室外、观光地等场合下也能使用
 

  赛星 “蓝海” 信息自收集系统及其云计算应用的应用领域包括:

   ■ 教科书:显示相关视频及补充信息,提高学生的理解能力

   ■ 旅游指南:显示各地的实景视频和其他游客的旅行经验

   ■ 广告·商品目录:显示今日价格、产品介绍、商业广告等

   ■ 报纸·杂志:显示新闻杂谈、背景介绍、关联消息等

   ■ 其它有类似要求的平面媒体等

 
  如果您对赛星的 “蓝海” 信息自收集应用和服务感兴趣,欲了解详细信息,请咨询上海赛星软件有限公司的技术支持人员。