据猿题库市场运营总监帅科介绍,小猿搜题上线一个月,用户已经达到了200万,而且还在以比较快的速度增长。那么,对于猿题库来说,为什么进入答疑领域?在猿题库的布局中,小猿搜题扮演者什么样的角色?

上线一个月200万用户,小猿搜题背后的技术故事

2015-01-22 09:42:25发布     来源:多知网    作者:初骊禹  

  多知网1月20日消息,今日,猿题库组织了一场名为“和工程师聊聊天”的媒体沟通会,小猿搜题项目负责人唐巧、猿题库研究部总监邓澍军对小猿搜题的功能、涉及到的技术做了介绍,并解答相关问题。

  据猿题库市场运营总监帅科介绍,小猿搜题上线一个月,用户已经达到了200万,而且还在以比较快的速度增长。

  那么,对于猿题库来说,为什么进入答疑领域?在猿题库的布局中,小猿搜题扮演者什么样的角色?

  猿题库定位学习系统,小猿搜题定位工具

  猿题库市场运营总监帅科表示,猿题库做小猿搜题主要有两个原因。一个原因是猿题库的技术团队一直在进行机器学习的研究,但是研究也需要实践,做这样一个产品能够得到锻炼。另一个原因是,看到了用户明确的需求,而且猿题库团队能够将此功能快速地实现。他说,做出小猿搜题,技术团队一共只用了三个月的时间。

  他同时表示,小猿搜题在用户需求和商业实现等方面,价值和权重都比猿题库要低很多。猿题库是一个智能学习系统,能够让学生爱上做题、爱上学习,真正帮助学生提高能力及分数,而小猿搜题是一个辅助工具,只能解决用户遇到难题时查看解析这样一个单一、具体的需求。

  小猿搜题的技术方案:图像识别+机器学习+搜索引擎

  据猿题库研究部总监邓澍军介绍,小猿搜题最终确定使用的方案是系统接收用户上传的图片后,经过预处理(即对图像的模糊、旋转、颜色反转等问题进行处理),切分(对图片中的汉字、英文、符合加以区别),识别(通过Deep Learning、标注数据、优化算法等对图中文字进一步识别),NLP纠错(利用语言模型进行纠错)等步骤,将题目转化成文字,然后在题库中进行搜索,最终返回题目答案以及解析。另外,这个过程中还使用了以图搜图的技术加以补充。

  目前,小猿搜题的技术团队主要在以下几个方面做功能的优化,一个是软件本身的大小,让用户能够很容易地下载下来,并在版本不高的安卓手机上能够顺畅运行。第二是团队做了一些处理使得用户无需注册就可以使用拍照答疑功能,同时也不需要担心自己的数据保存问题。当用户卸载小猿搜题后,如进行再次安装,还能够继续查看之前的搜题信息。

  之前,小猿搜题在公测阶段上线了人工答疑功能,后来又在一个月后取消了此项功能。据唐巧介绍,加入此项功能只是为了收集数据,即让用户在收到错误结果的时候进行上报,以此来收集标注数据,以便使系统能够逐步识别哪些题目不对或者哪些题目需要提升。一个月的时间内,这项功能收集了二三十万数据,为之后的产品技术更新迭代提供了数据支持。

  当多知网问到有关小猿搜题的盈利模式的问题时,帅科表示,小猿搜题目前会专注于解决用户的单一需求上,不会考虑盈利的事情。目前,小猿搜题还是会将重点放在题库的扩充和识别技术的提高上,暂时不会增加新的功能。“拍照搜题的用户需求非常单一、具体,就是一道题目不会做,需要立即找到解析和答案,所以我们应该把识别和搜索做到极致。其他的功能,如果不是用户需要的,而只是我们想让用户使用的,毫无价值。”唐巧说。(多知网 初骊禹)