首页 加密货币 立党:deepseek、moonshot、SRAM推理三家,都是可能挑战OpenAI的存在。

立党:deepseek、moonshot、SRAM推理三家,都是可能挑战OpenAI的存在。

过去一年,我一直跟大家讲,deepseek、moonshot、SRAM推理三家,都是可能挑战OpenAI的存在。 moo…

过去一年,我一直跟大家讲,deepseek、moonshot、SRAM推理三家,都是可能挑战OpenAI的存在。

moonshot就不说了,他们解决的核心问题是context window,这是用户解决复杂问题的核心需求,moonshot最开始给出了非常惊艳的答案——可惜后来别人也追上来了;

deepseek v2走了mixture of experts的路, 这条路Mixtral 8x7B已经帮他们探明了,就是用一个零头的training cost去完成training,就是省钱;另一个是multi head latent attention,能让deepseek早期用一堆烂显卡以极低的成本提供inference服务(0.28刀提供1M参数);

SRAM推理三家(Groq、Sambanova、Cerebras)信奉的是极致inference性能,自己设计architecture,把整个model全塞进最昂贵的SRAM里,速度动不动就2000~3000 tokens/s,性能直接是OpenAI、claude、google gemini的10~50倍,直接把nvidia架在火上烤。

牌桌上的每个竞争对手都是值得尊敬的,不过我还是想告诉你们,也是我这一年来反复跟你们强调的,

必须要遵循第一性原理作为价值判断,才能带来革命,要么速度快10倍(为AI agent和multi shot服务),要么training cost降低90%(500万刀训练一个模型),要么设计新的architecture让inference成本降低90%(打API价格战),要么context window直接拉长10倍,

在一个还在革命的领域,只有真正带来10~100倍的革命,才能带来真正的革命;提升20%甚至10%以下,完全就是糊弄人。

总而言之,哪怕竞赛中仅仅剩下了十几个玩家,绝大多数人也是亦步亦趋的人,能真正信奉10~100倍革命的人还是少数,能做到的更是少数。

而大公司病在这里尤为突出,最大的问题就是“愚蠢地烧钱”、“没有想象力地烧钱”,

要么像llama一样,闭着眼堆参数,没有实质性能提升,光浪费钱在训练上;

要么像google gemini一样,硬打价格战,提供每天免费API,跟全家桶绑定,愚蠢至极;

要么像字节豆包一样,像推广汽水音乐、抖音商城、西瓜视频一样,直接花钱买大V做视频,烧钱营销推广第一名,拿狗皮膏药App的方法玩推广;

事实证明,在技术革命的时代,你能信仰的,只有技术,只有技术革命,只有真正的10~100倍的革命,只有放弃平庸的路径依赖,

其他花里胡哨的,都是狗几把。

返回顶部
首页
爆料吃瓜TG群
打赏