• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
5865 search results

随着大语言模型和多模态技术的蓬勃发展,非结构化多模态数据处理已经成为数据处理的重要组成部分。面对海量数据与复杂模型带来的挑战,传统大数据引擎在异构资源调度、Python生态兼容性等方面的局限性日益凸显。本文将详述基于异构融合底座Ray重构混元数据管道的相关工作,通过云原生调度融合、计算范式统一及平台化建设,构建高效灵活的新一代AI数据底座,并深入解析我们在容错、资源利用率、规模化、可观测性等方面的优化实践。

1 Technology lddgo Shared on 2026-01-07

在得物(Poizon)业务场景中,算法生态已演进为涵盖交易搜索、社区推荐、图像识别及广告策略的多维复杂系统。请求从Java网关下发,进入 C++ 构建的高性能算法核心(DSearch检索、DGraph图计算、DFeature特征提取等)。 随着系统复杂度的指数级增长,我们对现有系统的可观测性进行了全面梳理,为了提高稳定性,我们希望建设一个业务场景维度全链路变更事件中心,以“聚焦做好可观测性”为核心目标,通过建设监控平台的事件中心与全链路可观测的核心产品,整合各平台资源与数据,提升系统的整体透明度和稳定性,从而提升业务稳定性和故障止血效率,为产品迭代奠定坚实的基础。

1 Technology lddgo Shared on 2026-01-07

随着AI技术在软件开发领域的快速发展,AI Coding作为一款强大的AI辅助开发工具,正在深刻改变着我们的开发模式。然而,在实际应用过程中,许多开发人员在早期使用这类工具时存在一些认知误区,影响了工具效能的最大化发挥。

1 Technology lddgo Shared on 2026-01-07

Agent全面爆发!万字长文详解上下文工程

1 Technology lddgo Shared on 2026-01-07

本文系统介绍了在生成式人工智能(GenAI)应用中控制模型输出内容的五种设计模式,并对比了各模式的适用场景、优缺点及典型反模式,为开发者提供了一套结构化的输出控制方法论。

1 Technology lddgo Shared on 2026-01-07

在飞速发展的互联网信息化时代下,抓住并充分利用“流量”将为业务增长带来“泼天”富贵,已成为共识。如何通过真实、海量的数据打造一个集成本、质量、效率于一体的融合流量管理平台,也成了各行各业的关注焦点,本文通过”拨测“与“融合流量管理”两个维度,来分享vivo在流量管理领域的一些实践和探索。

1 Technology lddgo Shared on 2026-01-07

自2022年11月30日ChatGPT问世以来,58同城TEG-AI Lab紧跟大语言模型技术发展步伐,以Model as a Service(MaaS)为理念打造了大语言模型平台,平台于2023年5月上线,支持大语言模型训练、推理等功能,是面向内部开发者推出的一站式大模型开发及服务运行平台。基于58同城生活服务领域业务特性,我们在开源通用大语言模型的基础上,使用58同城生活服务领域数据继续训练,打造了垂类大语言模型——灵犀大模型。目前大语言模型MaaS平台中灵犀大模型已接入内部数百个业务场景,日推理流量达到数千万,25年底相比年初提升近5倍。 

20 Technology lddgo Shared on 2026-01-06

支付宝超级 App 架构演进实践:构建面向未来的支付宝组件化范式

20 Technology lddgo Shared on 2026-01-06

代码索引是为了帮助我们提高代码搜索和导航效率的技术。常见的使用场景:IDE 中代码跳转,当点击跳转到实现时,IDE 会在索引中找到对应变量类的对应文件和行数,执行跳转动作。开发者可能想询问代码中某个具体的业务实现代码在哪个模块/文件中。非开发者:如产品/技术支持等同学可能希望在不借助开发者中介的情况下,对代码的某块业务实现有较准确的了解。在AI编码工具普及的今天,"代码索引"已成为支撑研发流程的核心能力。无论是IDE中的快速跳转,还是AI助手的精准问答,都离不开高效的代码索引技术。本文将结合团队近半年的项目实践,探讨从语义检索到结构化分析的技术路径。

13 Technology lddgo Shared on 2026-01-06

近年来,大语言模型(LLM)的能力边界不断拓展:从检索增强生成(RAG),为大模型接上了外部知识库,让它能给出更可靠的答案;到引入思维链(COT)机制,通过显式地生成思考过程,增强了模型的逻辑分析与复杂问题拆解能力;再到如今的工具调用(Tool Use),模型真正被赋予了像人类专家一样的能力,主动思考、规划、并利用工具去解决未知复杂问题。这标志着模型正从“被动响应者”向“主动智能体”演进,让模型在复杂问题解决、响应鲁棒性和生成的透明度上发生质的飞跃。然而,“巧妇难为无米之炊”,要训练出这样的智能体,光有算法远远不够,数据才是真正的燃料。DeepSeek的研究工作确立了当前大模型训练的主流范式,即先是高质量数据驱动的冷启动阶段,再是基于强化学习的优化阶段。但Tool Use的冷启数据难以获取,通用模型通常在海量纯文本上预训练,再通过人工标注的指令数据微调,但这些数据几乎不包含“如何分步调用工具,分析工具返回结果,做出决策”的完整轨迹。人工标注不仅成本高昂、效率低下,还难以覆盖复杂场景的多样性。而特有业务场景的Tool Use数据更加稀缺。因此,合成数据成为破局关键。

20 Technology lddgo Shared on 2026-01-06