• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
348 search results Contribute

谈到数据仓库, 一定离不开使用Extract-Transform-Load (ETL)或 Extract-Load-Transform (ELT)。将来源不同、格式各异的数据提取到数据仓库中,并进行处理加工。 传统的数据转换过程一般采用Extract-Transform-Load (ETL)来将业务数据转换为适合数仓的数据模型,然而,这依赖于独立于数仓外的ETL系统,因而维护成本较高。现在,以火山引擎ByteHouse为例的云原生数据仓库,凭借其强大的计算能力、可扩展性,开始全面支持Extract-Load-Transform (ELT)的能力,从而使用户免于维护多套异构系统。具体而言,用户可以将数据导入后,通过自定义的SQL语句,在ByteHouse内部进行数据转换,而无需依赖独立的ETL系统及资源。 火山引擎ByteHouse是一款基于开源ClickHouse推出的云原生数据仓库,本篇文章将介绍ByteHouse团队如何在ClickHouse的基础上,构建并优化ELT能力,具体包括四部分:ByteHouse在字节的应用、ByteHouse团队做ELT的初衷、ELT in Byt

18 Technology lddgo Shared on 2023-10-13

随着大数据处理需求的不断增加,更低成本的存储和更统一的分析视角变得愈发重要。数据仓库作为企业核心决策支持系统,如何接入外部数据存储已经是一个技术选型必须考虑的问题。也出于同样的考虑,ByConity 0.2.0 中发布了一系列对接外部存储的能力,初步实现对 Hive 外表及数据湖格式的接入。

29 Technology lddgo Shared on 2023-10-11

企业在进行营销推广时,广告投放通常是必备环节之一。为了避免投放“乱烧钱”,在大规模投放前,企业和广告优化师都会希望在多种广告策略中,找准效果更好策略才进行投放。 早期这样的方案决策只能通过“拍脑袋”,或者简易的分流投放测试来粗略进行。在火山引擎AB测试推出“广告投放AB实验”后,可逐步支撑企业快速、科学地验证不同投放策略的平均转化成本数据效果,并根据实验报告得到计划中不同素材、不同落地页、不同人群包、不同预算等变量到底哪种更好。

39 Technology lddgo Shared on 2023-10-11

基于大模型 + 知识库的 Code Review 实践

26 Technology lddgo Shared on 2023-10-11

用户分群指的是根据用户的标签、行为、偏好等维度,将用户划分为不同的群体,方便后续更精准地定制差异化的营销计划和推广策略。用户分群的目的是找到目标用户,进一步提升用户满意度和转化率。 本篇内容将从用户分群的角度出发,并结合火山引擎客户数据平台VeCDP产品实践,分享寻找“最佳”受众的方法论及落地路径,主要包含以下几个部分: 用户分群的思路和基本步骤 用户分群的常用方法和模型 基于CDP的分群构建与应用 用户分群构建与应用实践

18 Technology lddgo Shared on 2023-09-27

火山引擎veImageX演进之路主要介绍了veImageX在字节内部从2012年随着字节成长过程中逐步演进的过程,演进中包括V1、V2、V3版本并最终面向行业输出;整个演进过程中包括服务端、客户端、网络库、业务场景与优化等多个角度介绍在图像处理压缩、省成本与体验优化的经验与方案; 本篇文章重点介绍在web端演进和提供的能力,图片是 Web 站点中的重要元素,图片体积、格式、分辨率以及渲染方式对用户体验有着显著影响。火山引擎veImageX 为业务提供了灵活、高效的一站式图片解决方案和静态素材托管方案,涵盖了上传、存储、处理、分发、评估等图片生产和消费阶段的全部链路。

15 Technology lddgo Shared on 2023-09-26

作为头戴的追踪配件,VR手柄可以通过HMD(头戴显示设备)的inside-out光学追踪定位原理,计算出手柄的空间运动轨迹,同时结合6轴传感器实现6DoF空间定位。与此同时,结合手柄控制器的物理按键、马达反馈、摇杆等,用户还能获得逼真、细腻的触觉反馈,进一步增强虚拟现实人机交互的能力以及沉浸感,这也是目前无手柄方案所难以实现的。 目前主流VR手柄的追踪技术方案,包括光学追踪、自追踪和电磁追踪方案。

21 Technology lddgo Shared on 2023-09-22

马太效应,是社会学和经济学常用理论之一,通常指强者越强、弱者越弱的两极分化现象。如今,这股效应也在国内企业级数据洞察市场蔓延: 一方面,部分企业尚未意识到数据对于自身发展的价值,或者缺乏高效便捷的数智化产品/工具将庞杂数据变得“可看”“可用”,导致难以及时把握市场行情、做出科学决策,最终发展受限; 另一方面,深谙数据驱动的企业,则积极把握数字化时代飞速发展的红利,持续加码企业数智能力,将数据消费贯穿业务推进、管理决策、规划调整等多场景,保障业务健康、快速成长。 如何尽量缩小马太效应影响,帮助更多企业实现数据洞察领域的数字化升级,享受普惠式数据消费,正在成为现阶段的重要课题。

13 Technology lddgo Shared on 2023-09-22

点播成本节省的点其实涉及诸多部分,例如:CDN、转码、存储等,而利用播放器降本却是很多客户比较陌生的部分。火山引擎基于内部支撑抖音集团相关业务的实践,播放器恰恰是成本优化中最重要和最为依赖的部分。 火山引擎的视频团队做了份数据统计,在一个很经典的视频业务中,我们在2022年至2023年大约1年半的时间里,针对这个业务进行了33次成本优化点,其中13次是播放器主导的优化,其余的有12次也是需要播放器强配合的优化,也就是说在这个业务里,75%的成本优化是直接或间接由播放器参与,可见客户端对成本优化的关键作用。 最终我们在很多实践中也发现通过播放器的优化可以为点播业务节省20%甚至更多的成本,本篇内容就将聚焦在播放器层面如何节省成本这一主题。

36 Technology lddgo Shared on 2023-09-22

自上世纪50年代,以“计算机”作为代表性象征的信息革命开始,社会对于先进生产力的认知便开始逐步更迭——从信息化(通常认为是把企业中的信息资源与信息技术有机结合,从而提高企业的管理水平和效率)到数字化(普遍认为是以数据分析为核心,利用各种业务数据去反哺和优化业务过程)转变。 企业希望通过数字化来突破业务瓶颈,实现转型升级。而这期间,数据作为新的生产要素,其重要性毋庸置疑。 9月19日,2023火山引擎数据驱动科技峰会发布数据产品大语言模型(Large Language Models)应用:DataLeap-找数助手、DataLeap-开发助手和DataWind-分析助手,为企业提供从数据资产的检索、到数据开发,再到数据应用的全链路AI能力。 上述能力的发布,其目的就是让企业能更便捷地生产数据、应用数据,实现更普惠的数据消费,为数字化提供现实基础。 DataLeap是火山引擎数智平台(VeDI)推出的大数据研发治理套件,核心是帮助企业快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设。

14 Technology lddgo Shared on 2023-09-20