Library

ARTICLE
STRING
CONVERTER
ENCRYPT
NETWORK
MORE

CHART

MATH

COORDINATE

IMAGE

FILE
ARTICLE

STRING

CONVERTER

ENCRYPT

NETWORK

MORE

CHART

MATH

COORDINATE

IMAGE

FILE

Online Tools

All

Chinese

English

Newest

Hottest

50 search results Contribute

为什么Sora不是“世界模拟器”？

随着媒体狂炒 Sora，OpenAI的介绍材料中称Sora是 “world simulator”，世界模型这个词又进入视野，但很少有文章来介绍世界模型。这里回顾一下什么是世界模型，以及讨论 Sora 是不是 world simulator。

腾讯技术 aigc

16 Technology lddgo Shared on 2024-02-28

Sora技术原理解析

上篇文章我们介绍了Sora能做什么、有什么优劣势以及可能的应用前景，这篇文章我们基于Sora的官方技术文档介绍Sora的技术原理。

aigc

12 Technology lddgo Shared on 2024-02-28

“视频生成器”表皮之下，Sora究竟意味着什么？

Sora，源自日语的そら，空。色即是空。色、受、想、行、识，五蕴亦皆空。至大无外，至小无内，这个产品注定会给人无穷的想象空间。 OpenAI 团队用一个充满禅意的词，又一次开启了AIGC 的新时代。 Sora伪装成了一个视频生成器，可以生成一分钟的高清、高一致性视频，大家首先会认为它是和Pika、Runway一样的实用工具，也会先考虑它对视频、电影行业的颠覆。这当然没错，但看到OpenAI的技术报告，Video generation models as world simulators（视频生成模型作为世界模拟器），用到了世界模拟器这个终极大词，很明显其意义又远不止视频这么简单。

腾讯技术 aigc

12 Technology lddgo Shared on 2024-02-26

领先99%小白的Sora关键信息！

Sora是一个以视频生成为核心的多能力模型，本文简单介绍了什么是Sora，主要从Sora有多强、Sora技术突破以及复刻难度、意义和启发三个方向出发展开讨论。参与文末话题，赢取玻璃水杯和云朵灯啦。点击阅读原文讨论：《你最想用Sora生成什么样的视频？》

阿里巴巴技术 aigc

32 Technology lddgo Shared on 2024-02-23

Sora的前世今生：从文生图到文生视频

在2月16日凌晨，OpenAI首款文本生成视频模型Sora正式亮相，迅速在网络上引发广泛关注。对于Sora背后的技术原理，网络上已经充斥着各种分析和猜测，其中大多数分析都是从技术报告入手，对于普通读者来说难度相对较高。为了使技术原理更加通俗易懂，本文将从文本生成图像到文本生成视频的技术演进角度进行剖析，解读从AE、VAE、DDPM、LDM到DiT和Sora的技术发展路线，旨在为读者提供一条清晰简明的技术进化路径。

腾讯技术 aigc

39 Technology lddgo Shared on 2024-02-22

Sora：技术细节推测与原理解读，行业影响与成功关键

每逢年节，都是普罗大众从繁重的工作中抽离出来，回归生活与家庭的欢聚时光。然而今年的大年初六，OpenAI 发布的“文生视频”工具 Sora，却以又一次的 AI 技术变革姿态席卷了大街小巷，成为每个饭局讨论的焦点。GPT-4 发布的震撼犹在眼前，又一次的行业冲击接踵而至。被替代的危机论再次甚嚣尘上，未来真的没机会了吗？我们又该如何在变局中抓住机遇？或许，可以先从积极主动地了解危机本身，拥抱学习开始吧！

腾讯技术 aigc

34 Technology lddgo Shared on 2024-02-21

OpenAI Sora的优劣势和应用前景分析

在刚刚过去的2月15日，OpenAI发布了最新的视频生成AI模型Sora，可以基于文本指令或者图片、视频，生成最长60秒的内容丰富、栩栩如生的视频。OpenAI同时发布了Sora的技术文档《Video generation models as world simulators》，对Sora视频生成模型的原理进行了解释。

aigc

10 Technology lddgo Shared on 2024-02-20

基于参考物体的AIGC图像生成技术在家居导购领域的应用

本文深入探讨了基于参考物体的人工智能图像生成（AIGC）技术的最新进展。首先概述了该类技术如何发展至今，然后着重分析了两篇重要的相关学术论文。随后，文章针对家居导购领域的特殊应用场景，讨论了运用此项技术时遭遇的挑战和取得的最新效果。

阿里巴巴技术 aigc

9 Technology lddgo Shared on 2024-01-26

生成式 AI 带给软件开发的三个幻觉：速度快、质量高、人更少

软件行业苦降本增效久已。蔓延开去的开发周期，遥遥无望的上线时间，以及不断冒起的缺陷，怎么看都配不上这支精兵强将的队伍。生成式AI 似乎带来了曙光，它的表现让人耳目一新，不少人会这么想。它能自动生成代码，成本低，可重复，即抛的能力像云上的资源，这段代码不合适？扔掉好了，重新生成一段。很自然就会想到，是不是也不需要这么多精兵强将了，程序员们也很担心这一点。生成式 AI 回答我们的问题时，偶尔会抛出个煞有介事的答案，但如果你稍作检索，就会发现这个答案徒有其表：不是查无此言，就是一派胡言，这与人工智能的威名不符。这即所谓生成式 AI 的幻觉，hallucination——因为没有真实可靠的语料，它自作主张拼凑了一个假的回答。大模型技术仍然在不断更新，能让人感知到幻觉程度也在逐渐降低。但在它被投入到具体的领域和使用场景时，幻觉效应仍在发生，在这篇文章里我们会谈到的它在软件开发领域的应用。

aigc

11 Technology lddgo Shared on 2024-01-16

大模型应用实践：AIGC探索之旅

随着OpenAI推出ChatGPT，AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势，而是深刻地塑造着我们交流、工作和思考的方式。本文介绍了笔者理解的大模型和AIGC的密切联系，从历史沿革到实际应用案例，再到面临的技术挑战和伦理监管问题，探讨这一技术浪潮如何引领我们进入一个智能化的未来。

阿里巴巴技术 aigc

12 Technology lddgo Shared on 2024-01-03

English