• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
50 search results Contribute

随着媒体狂炒 Sora,OpenAI的介绍材料中称Sora是 “world simulator”,世界模型这个词又进入视野,但很少有文章来介绍世界模型。这里回顾一下什么是世界模型,以及讨论 Sora 是不是 world simulator。

16 Technology lddgo Shared on 2024-02-28

上篇文章我们介绍了Sora能做什么、有什么优劣势以及可能的应用前景,这篇文章我们基于Sora的官方技术文档介绍Sora的技术原理。

12 Technology lddgo Shared on 2024-02-28

Sora,源自日语的そら,空。色即是空。色、受、想、行、识,五蕴亦皆空。至大无外,至小无内,这个产品注定会给人无穷的想象空间。 OpenAI 团队用一个充满禅意的词,又一次开启了AIGC 的新时代。 Sora伪装成了一个视频生成器,可以生成一分钟的高清、高一致性视频,大家首先会认为它是和Pika、Runway一样的实用工具,也会先考虑它对视频、电影行业的颠覆。这当然没错,但看到OpenAI的技术报告,Video generation models as world simulators(视频生成模型作为世界模拟器),用到了世界模拟器这个终极大词,很明显其意义又远不止视频这么简单。

12 Technology lddgo Shared on 2024-02-26

Sora是一个以视频生成为核心的多能力模型,本文简单介绍了什么是Sora,主要从Sora有多强、Sora技术突破以及复刻难度、意义和启发三个方向出发展开讨论。 参与文末话题,赢取玻璃水杯和云朵灯啦。点击阅读原文讨论:《你最想用Sora生成什么样的视频?》

32 Technology lddgo Shared on 2024-02-23

在2月16日凌晨,OpenAI首款文本生成视频模型Sora正式亮相,迅速在网络上引发广泛关注。对于Sora背后的技术原理,网络上已经充斥着各种分析和猜测,其中大多数分析都是从技术报告入手,对于普通读者来说难度相对较高。为了使技术原理更加通俗易懂,本文将从文本生成图像到文本生成视频的技术演进角度进行剖析,解读从AE、VAE、DDPM、LDM到DiT和Sora的技术发展路线,旨在为读者提供一条清晰简明的技术进化路径。

37 Technology lddgo Shared on 2024-02-22

每逢年节,都是普罗大众从繁重的工作中抽离出来,回归生活与家庭的欢聚时光。然而今年的大年初六,OpenAI 发布的“文生视频”工具 Sora,却以又一次的 AI 技术变革姿态席卷了大街小巷,成为每个饭局讨论的焦点。GPT-4 发布的震撼犹在眼前,又一次的行业冲击接踵而至。 被替代的危机论再次甚嚣尘上,未来真的没机会了吗?我们又该如何在变局中抓住机遇?或许,可以先从积极主动地了解危机本身,拥抱学习开始吧!

34 Technology lddgo Shared on 2024-02-21

在刚刚过去的2月15日,OpenAI发布了最新的视频生成AI模型Sora,可以基于文本指令或者图片、视频,生成最长60秒的内容丰富、栩栩如生的视频。OpenAI同时发布了Sora的技术文档《Video generation models as world simulators》,对Sora视频生成模型的原理进行了解释。

10 Technology lddgo Shared on 2024-02-20

本文深入探讨了基于参考物体的人工智能图像生成(AIGC)技术的最新进展。首先概述了该类技术如何发展至今,然后着重分析了两篇重要的相关学术论文。随后,文章针对家居导购领域的特殊应用场景,讨论了运用此项技术时遭遇的挑战和取得的最新效果。

9 Technology lddgo Shared on 2024-01-26

软件行业苦降本增效久已。蔓延开去的开发周期,遥遥无望的上线时间,以及不断冒起的缺陷,怎么看都配不上这支精兵强将的队伍。生成式AI 似乎带来了曙光,它的表现让人耳目一新,不少人会这么想。它能自动生成代码,成本低,可重复,即抛的能力像云上的资源,这段代码不合适?扔掉好了,重新生成一段。很自然就会想到,是不是也不需要这么多精兵强将了,程序员们也很担心这一点。 生成式 AI 回答我们的问题时,偶尔会抛出个煞有介事的答案,但如果你稍作检索,就会发现这个答案徒有其表:不是查无此言,就是一派胡言,这与人工智能的威名不符。这即所谓生成式 AI 的幻觉,hallucination——因为没有真实可靠的语料,它自作主张拼凑了一个假的回答。 大模型技术仍然在不断更新,能让人感知到幻觉程度也在逐渐降低。但在它被投入到具体的领域和使用场景时,幻觉效应仍在发生,在这篇文章里我们会谈到的它在软件开发领域的应用。

11 Technology lddgo Shared on 2024-01-16

随着OpenAI推出ChatGPT,AIGC迎来了前所未有的发展机遇。大模型技术已经不仅仅是技术趋势,而是深刻地塑造着我们交流、工作和思考的方式。本文介绍了笔者理解的大模型和AIGC的密切联系,从历史沿革到实际应用案例,再到面临的技术挑战和伦理监管问题,探讨这一技术浪潮如何引领我们进入一个智能化的未来。

12 Technology lddgo Shared on 2024-01-03