本文重点介绍使用微调框架unsloth,围绕DeepSeek R1 Distill 7B模型进行高效微调,并介绍用于推理大模型高效微调的COT数据集的创建和使用方法,并在一个medical-o1-reasoning-SFT数据集上完成高效微调实战,并最终达到问答风格优化&知识灌注目的。
从 ChatGPT 到 DeepSeek 再到最近大热的 Manus,AI 技术从模型端的破圈进一步扩展到了 Agent 方向。拥有一个定制化的、能够理解你业务需求的 AI 助手不再是科幻,而是触手可及的现实。 然而,市面上的通用大模型往往难以深入理解特定领域知识,更不用说完全掌控数据隐私。本文将带你走进 AI 定制化的世界,从模型微调到功能开发,从技术探索到产品思考,一站式解决你的 AI 落地难题。
自从ChatGPT问世以来,大模型凭借其强大的语义理解和生成能力开始在多个领域引领技术变革。但大模型在房产推荐场景的应用上仍存在一些瓶颈: 其一,数据形态的适配难题。房产推荐依赖房源价格、户型、地理位置等强结构化数据,而大模型则更适配自然语言文本,这要求构建起推荐特征与大模型输入之间的有效转换。 其二,大模型响应的时效挑战。算法需要根据用户的线上行为实时调整推荐方向,大模型由于其计算速度影响很难在用户兴趣变化时快速响应。 其三,参与模式的边界定义。大模型有多种参与推荐的形式,可以是直接生成推荐或辅助特征提取,需要讨论哪种更适合房产场景。 基于以上背景,58同城房产事业群(HBG)推荐算法团队和58同城AI Lab进行深度的项目合作,以多业务、多场景、多模式的方式开展算法落地实践,尤其是在大模型画像推理和大模型Embedding上,取得了一些阶段性成果,本文将分享我们的实践案例及经验。
在数字化浪潮席卷的当下,业务的高效运营与创新发展离不开强大的技术支撑。对于各类线上业务而言,交易系统作为连接用户与服务的关键枢纽,其成熟度与完整性直接决定了业务的竞争力。一套卓越的交易系统,不仅是业务流程的数字化载体,更是提升运营效率、优化用户体验、推动业务创新的核心驱动力。大会员业务精心打造的交易系统,正是这样一个集高效、灵活、稳定于一身的强大平台,它以模块化的架构、先进的技术组件和完善的功能体系,为业务的持续增长和生态的繁荣发展奠定了坚实基础。
最近几年,大模型在技术领域的火热程度属于一骑绝尘遥遥领先,它已经深刻地影响了“编程”领域,且正在各个领域迅速渗透。与此同时,普通开发者也变得非常地焦虑,因为实实在在感受到了它强大的威力,担心哪天自己就被取代。与其担忧,我们不如主动拥抱这种技术变革。
因为年前刚搬家,家中物品非常杂乱,同时在搬家的过程中发现过去在家庭物资管理上存在很多问题,总结有: 储物空间浪费:过期药品和其他过期物品长期占据储物空间,降低了空间有效利用率。 食品过期浪费:易过期食品的有效期跟踪机制缺失,导致食品经常过期被扔,造成资源浪费。 物品难以定位:没有合理收纳规划和物品位置标记,急需物品时难以快速找到,往往搬家时才发现。 重复采购:过期物品未清理,物品位置难确定,购物前无法准确知晓库存,导致重复购买,造成经济损失。 鉴于以上种种困扰,春节期间,我借助 Cursor 以及 Trae(Claude-3.5-Sonnet 与 deepseek-r1),开发出一款家庭物资管理应用,期望通过这个工具,能够显著提升家庭物资管理的效率和质量,让家庭生活更加有序便捷。同时也对这两块IDE和模型进行了深度的使用和体验
猫耳前端在开发活动的过程中,经历过传统的 pro code 阶段,即活动页面完全由前端开发编码实现,直到 2020 年接入公司内部的低代码活动平台,满足了大部分日常活动的需求,运营可自主配置活动并上线,释放了相当一部分的开发人力。不过,此时的方案仍然无法很好地服务大型直播活动场景,比如年度 S 级的直播活动,这类活动赛程多且持续时间长(可长达两周),页面和组件都包含多种状态,运营难以配置出大型直播活动的所有需求,故此阶段的大型活动仍然完全由开发编码实现,需要占用较多人力,但此类活动从数量上来看连 1% 都不到。鉴于我们已在日常活动中积累维护了相当多功能的低代码组件,如何复用已有的低代码组件来更快实现更多活动玩法就成了一个值得研究的问题。此外,大型活动从筹备到结束,时间长达数月,而密集开发阶段可能只占其中的一个月,密集开发结束后的长尾需求又该如何优化提效?接下来本文将介绍猫耳前端在活动场景的低代码探索经验,以及最终稳定的开发模式。
作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。过去一年,我们通过在视频生成、图文联合生成等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AIGC内容生成技术总结》是我们摸索出的一部分实践经验,我们将开启一段时间的内容AI专题连载,欢迎大家一起交流进步。