笑斌(joshuasui)
@0p8fg30w4pyi9wqs
ata.atatech.org/articles/12020372912?spm=ata.23639420.0.0.155275368QMXX7
Feb 21, 2025
2
ata.atatech.org/articles/12020325212?spm=ata.23639420.0.0.15527536zvwVqj
Feb 18, 2025
2
c.cainiao-inc.com/cone/app_c261966e/615d4483e988440ea7d35cda37c791ef
Feb 12, 2025
quaily.com/op7418/p/aigc-weekly-108
Feb 11, 2025
1
leetcode.com/explore/learn/card/sorting/693/introduction/4431/
Feb 8, 2025
1
quaily.com/op7418/p/aigc-weekly-107
Feb 8, 2025
3
x.com/op7418/status/1885667569203646895/photo/1
Feb 8, 2025
1
大模型训练推理整个过程中的数据血缘很重要。能够帮助进行跟踪溯源、排查定位,大幅提升效率。
不同AI基础框架间竞争激烈,企业根据多种因素选择适合的框架,甚至“并行”探索。一些应用上的信号:根据字节同学的反馈,框架选择会综合硬件、工程师习惯等多种因素,字节内部多个团队使用不同Infra方案竞争,目前来看pytorch会相对广泛一些,一方面算法同学更习惯pytorch,另一方面pytorch也同时支持数据预处理(包含data数据处理模块)和训练(包括pretrain和posttrain)。ray的处理由于是无状态的,当前更多被应用于图片视频等处理,这也是数据join等带状态结构化处理未使用它的原因之一。ray自身由于缺乏完善的容错机制,还需要一些额外的工作。字节同时在基于ray进行强化学习的尝试。OpenAI之前用过ray,现在不怎么用了。