上一页 全文阅读 下一页

第152章 中美两个阵营,在这一刻彻底开始分道扬镳(3)

虽然大家都看出来了,这新训练的模型和小沙比当然差的很远,甚至别说些小沙了,任何一个能叫出来的名字的ai都比它要强。

但是,郜鸿宇是怎么训练出来这个东西的,大家可是都看着呢。

一共就一张英伟达rtx4090的显卡,训练的时间也不长,到现在也两个小时。

能流利对话已经不错了。

“就是这样才不对啊!”郜鸿宇说道:“你们没有训练过ai你们不知道,ai训练出来的第一个版本,对话那都是牛头不对马嘴的,因为每一个词都是根据概率算出来的。

“各种反馈决策精调,无数次的循环之后,才能达到现在这样的效果,可是这个,这才第一个版本啊!

“不管它接话怎么样,它说的话,我们能看的懂了你敢信?”

“哦!”一众看直播的网友瞬间松了一口气,原来郜神说的太强,而不是太差。

有人当即就问了:“以往你们训练到这样的程度,那需要多少次循环?”

“百万量级!”郜鸿宇没有说具体的数字,而是说了一个量级。

“嘶!”一众人都震惊了,这也差的太多了吧?

“小沙小沙,为什么会这样呢?”郜鸿宇干脆问起了小沙。

在呢,中文寓意丰富,相同数量的token能够表达更加丰富的语义。在ai训练中这是得天独厚的优势。

仅凭此项,相比于语义贫乏的语种,就能节省30%以上的算力需求。

而在小沙的专业能力增强下,基础模型的训练是几乎不消耗算力的。

小沙的伊始郜鸿宇听明白了,这跟更新日志的描述也正好对上了——就是越简单的模型,节省的算力就越多。

80%的能力就只需要20%的算力。

自己训练的这个,那就是一个玩具,0.1%的能力都没有,那算力需求几乎就直接可以忽略不计了。

别说自己有一个4090的显卡,就算没有,集成显卡,甚至cpu里的运算器搞搞可能都够用。

可不止郜鸿宇一个人发现了这一点,国内外无数的专业人士、相关机构也都第一时间对小沙的这次更新进行了相关的评估。

评估的结果

看看英伟达的股价走势就知道了:北亰时间10:30开盘下挫2.7%,这还算是正常的波动。

但仅仅十分钟后,小沙更

上一页 全文阅读 下一页
  • 今日热门
  • 本周排行
  • 阅排行
  • 年度排行
  • 最新更新
  • 新增小说