日前,在中国科学技术协会近期举办的“大模型应用场景研讨会”上,夸克大模型在快速阅读、创作润色等四大场景中表演出了效率提升潜力,引发了科技工作者的热议和期待。

  凭借在搜索业务和智能技术上的长期积累,近期发布的夸克大模型利用数据、平台、知识增强等优势,可以大幅提升知识正确性。在医疗等垂直领域,夸克已经把幻觉率降低在5%以内,成为国内大模中的佼佼者。

  夸克技术负责人蒋冠军在研讨会上提出,大模型在学术领域的应用,需要从两个方向发力。首先,要拥有高质量的数据样本和知识库才能更好地激发大模型能力。围绕科研所需要的深度知识,建立一套依托大模型技术的方法和机制。这些都需要平台和社会各界的共同努力。

  在日常学术研究中,夸克大模型有望在四类场景中发挥作用。首先,在资料收集阶段,大模型可以更精准的获取知识信息,有能力查找到科研人员所需要的准确数据。在快速阅读上,大模型可以快速提炼专业期刊、杂志中的核心观点和方法。再次,在内容翻译中,很多文献都需要更准确和专业的翻译,大模型的翻译速度和质量比传统方式更高体验更好。最后,在创作润色过程中,大模型可以更好地启发作者以及润色文章。

  11月中旬,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将评估教育通用搜索、办公健康、学习、职场等部门场景。在C-Eval和CMMLU两个大权威得分中,夸克大模型也进入双榜第一,进一步检验国产大模型在数据精调及模型框架上的能力提升。

  目前,夸克大模型的优势源于智能技术与搜索业务实力基础,蒋冠军认为,夸克大模型有四大优势:第一、最全面的通用知识数据和行业知识数据,以及知识理解和评估体系;第二、得益于搜索技术体系的积累,拥有训练千亿级参数平台的模型能力;第三、拥有长期定制产品经验的智能技术产运团队。第四、拥有全行业的知识增强技术上述优势也对提升知识的正确性起到了关键作用。

  此外,包括夸克网盘、夸克扫描王一系列智能工具,在加入大模型能力后,能够从数据存储、数据录入等方面进一步帮助科研工作者更好地完成学术研究。在严谨、求真的等方面在发挥科研领域中,夸克将充分在知识正确性以及智能工具上的能力,成为科研人员的提效助手。

夸克网盘展示

当阿里巴巴集团新任CEO吴泳铭把一款名叫夸克的产品放在阿里的战略级创新业务时,背后的大部分反应是,夸克是谁?

11月16日,吴泳铭财报电话会上把夸克作为第一批战略级创新业务——1688、闲鱼、钉钉、夸克,这被称为“阿里四小龙”。事实上,这也是阿里巴巴多年以来的财报中首次提到夸克这项业务。

一周后的11月22日,夸克在北京举办了一场小规模闭门技术交流会,这是夸克被阿里新任CEO吴泳铭所在阿里巴巴集团战略级创新业务后,首次露面。

夸克是一个很多人会陌生、并不经常出现在报道中的产品。不过从公开数据来看,夸克累计用户量已经过亿,经常在苹果商店免费榜排第一。今年9月,夸克日活用户同比增长了35%,是甚至整个互联网行业少见的、能保持双倍高增长的产品。

一位夸克内部人士表示,他们也是直到那时,才知道自己做的业务成为了集团重心。相比阿里其他业务,夸克极少对外发声,夸克事业群总裁吴嘉几乎从未接受过媒体采访。

在阿里内部,夸克也有一层神秘的面纱,记者询问多位阿里工作5年以上的员工,他们对夸克还不熟悉,只是猜测说,目前夸克业务增长较快,而且年轻人的思维,也有AI能力,也许是夸克被集团重视的原因。

夸克是谁

修炼是阿里内部人士许多也对夸克感到陌生,但在人们的崇拜中,夸克的认知和使用率非常高。

记者随机询问了8个20岁左右的年轻人,其中1个人听过夸克但没用过,2个人只用夸克,完全不用其他浏览器或搜索软件。5个人会同时使用夸克和百度,并把夸克当做第一个使用平台时。

一位23岁的研究生使用夸克超过3年,“最开始使用是因为它无广告、无弹窗,还有一些好用的功能,比如扫描知识物、文件提取、云收藏等,还有夸克网盘下载速度很快。”他告诉记者,夸克能够满足他在学习、工作中的大部分需求。

另一个21岁的大学生也是夸克的忠实用户,他主要用夸克搜题、看小说,他最喜欢的地方是,夸克从不会弹出广告,效果比较。

夸克技术负责人蒋冠军告诉记者,夸克用户中,50%以上用户都是25岁以下年轻。

记者最近几天深度体验了夸克,使用体验与百度有所不同。最近,“蚌埠”受到关注,记者随机在百度和夸克搜索,百度显示的第一条是58同城的广告,第二条是安居客的广告。夸克第一条是蚌埠政府官网,第二条是蚌埠周边餐饮美食。记者想知道“阿里四小龙”的具体用户数,在百度搜“1688用户量”时,翻了3屏没有找到有用的数字。夸克也没有最新数据,不过在首屏显示,2016年时,1688注册会员数已经破亿。

夸克是一个独立的APP,内含搜索、网盘、扫描、学习、文档、健康、小说等业务。其中,搜索是夸克的核心业务,最近一年,夸克网盘增长最快。

今年刚考研是上岸的大学生小彤最常用的夸克网盘。她在备考期间用夸克搜索复习资料,找到后直接存入夸克网盘。因为资料数量多经常,会记不清文件名,无法准确搜索到文件,一项翻找又很浪费时间。通过夸克网盘,小彤快速发现,即使模糊搜索,也能找到该文件。

从UC开始

全民和年轻人打交道,看起来像是后起新秀的夸克,其实是一款已有7年历史的产品。纵观夸克发展历程,2018年、2020年是关键之年,这两年的夸克战略方向做了变迁,为夸克之后的用户增长打下基础。

2016年8月,夸克由UC浏览器内部孵化,当时高效的思路是做一款极简、无广告的浏览器。夸克当时团队只有十几名成员,除UC骨干外,团队主力还有几个95后实习生。

这个产品定位是创新项目,没有盈利压力,因此他们能够以自主、灵活的思路打造产品。

上线1年后,夸克用户数达到百万。几年后,夸克的用户量始终在百万级徘徊,没有实现突破,也没有得到更多关注。

2018年,夸克把业务重心从浏览器调整为搜索,为了和其他搜索软件做差异化,夸克定位为“智能搜索”,首次把AI提上议程。

方向改变后,前几年夸克相对平稳。直到2020年,夸克用户量实现了突破,首次达到千万级,活跃1年用户增加了5倍,搜索量增长6倍。当年,夸克从UC母体独立,成为“智能搜索业务部”的一部分,原UC事业部总经理、书旗事业部总经理吴嘉兼任部门负责人。

此前夸克内部人士告诉记者,2020年夸克把业务重心聚焦在工作和学习领域,做了一些场景化部署,从而快速获得了年轻用户。

场景化可以布置理解为,把一个细分式领域做到最极致,让用户傻瓜使用。比如每个学生都会面临高考,但他们对于如何填高考志愿并不懂。在夸克内,考生填入自己所在所在省份、文理科分类、高考分数、心仪学校或专业等信息后,夸克能帮考生测志愿录取率,也可以提供往届同分考生最终去向等信息。这些信息或许在其他平台多重搜索也能得到结果,在夸克里,填入基本信息后就可以立刻得到结果,直接高效。

“刚开始是考生自己用,这两位考生的80后家长、亲戚也来了。他们用了之后觉得产品不错,也留下了。”夸克人士说,高考已经成为夸克每年的增长重要场景,每到高考,用户增长就很快。

2020年2023年,夸克每年用户数量都在200%以上,2023年11月累计服务用户过亿。

夸克类似细分功能还有视频语音转文字、PDF转Word、一键生成服装拍照、相关识别、语音听听、网盘视频5倍速小说等。虽然看起来都是小功能,但在同类产品中,夸克做到了功能多且简单好用,“总有一些是你需要的”,于是新进来的用户逐渐沉淀。

用户增长的同时,夸克在阿里集团的归属经历变化。2019年以前,夸克隶属于阿里大文娱推出了UC事业部,2019年6月,阿里巴巴组建了创新业务事业群,UC及推出了移动创新业务隶属于这个新事业群。当时同在创新业务事业群的,还有天猫精灵、阿里文学、阿里音乐等。彼时的夸克,仍然只是一个“移动创新业务”,没有得到太多关注。

2021年4月,阿里在原有创新业务事业群的基础上成立了智能信息事业群,包括夸克、UC浏览器、书旗小说等产品,主要聚焦信息服务方向的转型创新。这一次,夸克成为同年10月,夸克进一步独立,成为单独的夸克事业部。

目前,夸克事业部仍属于智能信息事业群,隶属事业群总裁为吴嘉。

为何重要

与阿里任命的大部分业务扎根杭州不同,夸克目前员工在北京、杭州、广州三地办公。

望京阿里中心B座,是夸克北京团队所在的楼。这栋楼里还有优酷、UC、书旗、大麦、阿里影业等业务。记者到访当天,楼层显示屏正在播放阿里影业年终盛典的盛大场面。在楼道栏展示,主要贴的是优酷热播剧。

阿里推出了业务划分“1+6+N”,夸克只是“N”中的一个小分子,不是“1”的序列,更不在“6”的定价。现在夸克却成为了阿里集团战略级创新业务。为什么是夸克?

吴泳铭在11月16日的财报电话会上表示,夸克是深受年轻一代喜爱的搜索和知识产品。他认为,在大模型时代,面向学生群体和年轻人,夸克有巨大的机会创造出的重复性搜索产品。

阿里Q3财报中公布了一个数据:2023年9月,夸克日活用户数同比增长35%。另一个“阿里四小龙”鱼的需求同比增长20%。

夸克内部人士告诉记者,夸克新增长的用户,主要是年轻人,这被视为未来潜力所在。

11月22日,夸克小规模技术交流会上,主要是讨论大模型。11月14日,夸克发布了自己自研的千亿参数通用大模型,在当前大公司上线业务主要使用集团研发的通用大型号的通用做法相比,略有特殊。

蒋冠军告诉记者,夸克选择自研大模型,一是因为自身AI能力足够强,二是相比在集团大模型基础上做引导调优,用自己的大模型效率更高。夸克技术团队在2018年年将方向研发定为AI,因此他们有技术积淀,可以做这件事。

夸克目前业务仍然是搜索,加入大模型能力后,蒋冠军表示,搜索功能会被大模型的功能迭代。现在幼儿对这种变革的认知并不明显,他解释说,是因为大模型推理和梳理能力还没那么好,大模型本身的技术能力,还没有到革新的程度。“从新技术的出现到新产品的出现,还是周期很长的。”这是历史经验反复告诉我们的。

大模型能力的夸克,与吴泳铭所说的“创造出的创新性搜索产品”方向一致。不过,加入集团重点业务后,夸克也终将面临盈利问题。百度搜索广告指标,是因为搜索是百度现金牛业务,每年能为百度提供近千亿元收入。当夸克不再只是快速创新业务,需要给集团贡献收入后,夸克还能继续好用、继续增长吗?

现在已经有一些用户提出意见。上述使用夸克已有3年的23岁研究生发现,今年使用夸克时,偶尔出现弹出式、侧边栏式的广告,运行其他软件的时候又收到夸克的替代品,用户的使用体验受到一定影响。

夸克目前商业模式主要依靠会员收费,APP内包含四种会员体系:夸克网盘会员、扫描王、小说会员、学习会员。有用户发现,夸克开通付费后,不付费的会员使用夸克网盘、文件扫描、格式转换等功能时,受到不同程度的限制,包括文件下载速度和免费使用次数等。

在小而美的阶段,夸克证明了自己,也获得了相应群体层面的青睐。接下来,夸克不能做到过去而美做到大而强,不能用大模型替代搜索,实现弯道超车,住吴永铭所说的真正的“巨大机遇”,才是考验夸克的地方。