自DeepSeek R1技术报告🐳开放以来,开源社区涌现了多种「复现」工作。本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索R1/R1-zero中强化学习步骤带来的模型效果提升,并尝试展望R1技术在未来模型训练与业务落地上的前景
本文讲述 DeepSeek-R1 出来以后,作者尝试使用提示词工程在 Claude 上“复刻”DeepSeek-R1 使用效果的过程,包括背景介绍、复刻的尝试与优化,还阐述了复刻的意义、对提示词工程的影响。
直播间互动体验框架技术实践,揭秘性能与稳定性优化之道,快来探索吧!在百度直播间歌会红包等活动中,我们创新性地将红包互动与高质内容深度融合,通过技术架构升级与系统性优化,打造了"音乐+红包"(边听歌边抢红包)的沉浸式体验。本次实践显著提升了直播间的并发承载能力、实时互动响应速度和用户参与满意度,同时沉淀出可复用的技术方案,为后续大型直播活动奠定坚实基础。
近年来,线上购物平台在用户日常生活中扮演着越来越重要的角色。为了满足用户多样化的购物需求,当前大多电商App往往会集成多种购物场景(首页瀑布流、详情页、订单页等等),为不同用户提供量身定制的购物服务。随之而来,多场景学习(Multi-scenario Learning,MSL)在电商平台的搜索推荐系统中也取得了蓬勃发展。下面我们从得物App整体和得物App搜索两个角度出发,深入分析不同场景的特性。
在信息时代,用户的手机应用访问量日益增多,DNS 解析作为连接互联网的关键环节,也被提出了更高要求。这一背景下,HTTPDNS 域名解析服务凭借防劫持、精准调度、实时解析生效等特性,逐渐成为行业主流解决方案。我们构建了 vivo HTTPDNS 端到端的一体化解决方案,通过对 HTTPDNS SDK、HTTPDNS 服务端、统一调度网关和全链路监控4大模块的能力及架构优化,显著提升了端侧业务的访问体验,支撑业务高效、稳定开展。
在今年的春节期间,DeepSeek 火出了圈。凭借 DeepSeek-V3 与 DeepSeek-R1 的创新技术和卓越表现,DeepSeek 迅速成为了行业内外的焦点。不管是技术专家还是普通用户,都对 DeepSeek 赞不绝口。我们特别准备了这篇技术科普文章,期望无论你是不是技术同学,都能够读懂 DeepSeek。
人工智能技术的飞速进步,正在重塑全球商业格局,其影响辐射到各个行业领域。鉴于此,阿里云云栖号特别推出《一周AI大事件》,汇聚全球人工智能的最新动态。
本文讲述作者如何解决客户集群中出现的OOM(Out of Memory)和Pod驱逐问题。文章不仅详细记录了问题的发生背景、现象特征,还深入探讨了排查过程中的关键步骤和技术细节。