开云体育
开云体育官方问DeepSeek:孩子手机成瘾的底层逻辑 创新突破算力禁运_中华网
开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!问DeepSeek:孩子手机成瘾的底层逻辑 创新突破算力禁运!想象一下,在世界厨艺锦标赛上,你和一群有梦想的年轻人在一个破旧的毛坯灶台上,炒出了惊艳全球的创新菜。而你的对手在五星级酒店里带领豪华团队,用着顶级厨具和丰富食材,却在比赛中惜败于你,引发全球轰动。这不是虚构的故事,这是正在发生的现实。你就是低调积累许久的“一代食神”——DeepSeek。
年初,DeepSeek App 横空出世,其创新性的架构设计和工程化落地使得模型性能在极低成本下达到全球顶尖水平。加上用户体验良好的思维链展示和模型开源的方式,春节期间用户量迅速增长。这一现象不仅吸引了全球关注,还促使全球资本重新评估中国科技资产,AI投资逻辑悄然转变。特别是在大模型领域,DeepSeek成为一匹黑马,挑战了过去巨额投入但屡次推迟的ChatGPT5以及国内六小龙的地位。中国AI企业在突破“算力禁运”后,正面临高质量数据稀缺的挑战,尤其是高质量、低成本、多种类、多模态的数据,将成为未来AI产业发展的关键。
主流的AI大模型训练方式基于Transformer进行下一个Token的预测,通过互联网吸收海量数据,并对匹配结果偏差较大的部分进行人工打分或标签,提升模型准确性。AI大模型的核心要素是数据、算法和算力。当前,算力硬件性能已接近瓶颈,迭代速度远不及大模型日益增长的训练需求和能耗压力。可供预训练的数据也逐渐见顶,简单增加数据和计算能力的时代已经结束。随着大语言模型向多模态发展,算力和数据的挑战将进一步加剧。
我国面临美国的“芯片禁令”,无法使用高端算力设备,只能从算法和数据两方面突围。过去普遍认为我国与OpenAI等美国头部AI公司存在1到2年的差距。根据CB Insights发布的数据,2024年中国AI初创企业筹集的资金仅占美国的7%。丰厚的资金储备意味着能高薪招揽顶尖人才,进一步巩固算法优势。在DeepSeekV3之前,我国人工智能领域的形势严峻。
在DeepSeekV3和R1推出后,顶尖的模型效果和用户体验,加上开源特性,大大缓解了我国在算法和算力上的困境,但数据方面的挑战依然存在。高质量数据能够保障模型推理回答的准确性,多模态多种类的数据能提升模型的泛化性和推理能力。然而,国内和国外在可用数据量上存在天然差距。据W3Techs调研显示,英文网站占比为59.3%,而中文只有1.3%。国内可供训练的公开中文数据不足,标准化程度也不高。IDC和浪潮信息的研究显示,目前企业在应用人工智能中面临的最大挑战是缺乏高质量可用数据,占比高达66%。此外,数据采集与处理是国内企业在生成式AI应用时的主要支出方向。
DeepSeek采用创新性架构(MLA+MoE),解决了许多工程化难题,使其在极低成本下成为最强的开源基础模型之一。DeepSeek的关键在于使用数据蒸馏技术,得到更为精炼有用的数据。具体而言,DeepSeek-R1-Zero模型通过自我尝试和调整行为来学习,不需要预先标注的数据。该模型在数学和编程方面表现优异,但也存在可读性差的问题。为此,DeepSeek团队通过监督微调和强化学习优化模型,使生成的答案更清晰,语言更统一。
DeepSeek除了在算法层面进行创新和优化,其核心步骤中的数据都是自行人工处理或撰写的。爆火后,DeepSeek开启了数据百晓生实习生招聘,岗位要求不高但薪资丰厚,显示出对高质量数据的重视。值得注意的是,该岗位优先考虑小语种专业,这可能是为了进军全球市场所做的准备。
在具身智能和自动驾驶领域,数据同样面临挑战。上海交大博导卢策吾教授指出,具身智能面临数据规模不足的问题,工业级应用需要大量数据才能达到标准。数据采集成本高昂,限制了数据规模。在自动驾驶领域,端到端技术的核心在于通过大量数据训练模型,使其识别和预测各种驾驶场景。高质量数据决定了模型输出的准确性和可靠性。华为在智驾方面的一半投入用于数据采集和处理。特斯拉FSD测试里程需达60亿英里才能满足监管要求,长尾数据的收集难度和成本更高。
获取高质量数据的方式主要有标注、采集和生成。数据标注以人机协同为主,未来有望出现自动化程度更高的平台。数据采集主要通过人工、设备或爬虫等方式进行,适用于多种领域。数据生成则处于早期阶段,其中世界模型受到广泛关注,旨在生成高质量虚拟场景,用于数据处理和模型训练。虽然世界模型不能完全替代数据采集,但可以实现有效互补。
为解决人工智能产业中的数据痛点,多地政府加速推动高质量数据建设。国家数据局在北京召开高质量数据集建设工作启动会,武汉市发布促进人工智能产业发展政策措施,深圳市加快构建高价值垂类数据集和具身智能数据集。这些举措表明,中国科技创新变革是举国推动的结果,人才红利叠加完备产业链形成坚实基础,科研型企业家实现了范式创新。还有许多优秀创业者和研发团队在日夜兼程,政府也在积极推动基础设施建设,为创新提供土壤。