久久精品123,午夜国产欧美理论在线播放,国产精品影视天天线,国内自拍亚洲

您的位置:首頁>新聞 > 要聞 >

觀點:MosaicML 推出 30B 模型 — 挑戰 LLaMA、Falcon 和 GPT

2023-06-23 22:49:11    來源:博客園

MosaicML正在推出其第二個開源大型語言模型(LLM),稱為MPT-30B,這是繼五月份首次推出的較小的MPT-7B模型之后。

為了討論新模型及其對開發人員的意義,我采訪了MosaicML聯合創始人兼首席執行官Naveen Rao。他之前的創業公司是Nervana,這是一家深度學習公司,于2016年被英特爾收購,所以他最近在人工智能行業并不重要。

顧名思義,MPT-30B是一個300億參數模型。該公司聲稱它在質量上超過了OpenAI的GPT-3,盡管其參數數量約為1/6(GPT-3有1750億個)?!斑@意味著MPT-30B更容易在本地硬件上運行,并且部署推理的成本要低得多,”該公司表示。


(相關資料圖)

MosaicML vs. LLaMA 和 Falcon

MPT-30B比其他模型(包括GPT-3,LLaMA和Falcon(每個2,000個令牌)在更長的序列(最多8,000個令牌)上進行訓練。根據MosaicML的說法,“它旨在在實踐中處理更長的序列,使其非常適合數據密集型企業應用程序。

實際上,這意味著用戶可以輸入更長的提示。事實上,MosaicML之前的7B參數模型帶有一個微調選項,稱為MPT-7B-StoryWriter-65k+,具有巨大的65,000“上下文長度”。

“更長的上下文[長度]意味著更靈活的用法,”Rao說。“我們將有微調的版本,特別適合寫散文——寫更長的輸出。

MosaicML平臺;通過其公司博客

Rao想要強調的另一個區別是它的注意力機制。當谷歌在2017年發表其著名的關于變壓器技術的論文《注意力是你所需要的一切》(Attention Is All You Need)時,它指出,“多頭自我注意”是為AI提供突破的訓練機制(OpenAI隨后借用這一見解來構建GPT)。

“注意力是變壓器模型的內在部分,”Rao解釋道。“這實際上使他們能夠看到一個句子,一個段落或整個文本語料庫的聯系。

Rao 告訴我,MosaicML 使用了一種名為“閃光注意力”的技術,這是 2022 年一篇學術論文的主題。

“它使你能夠更快地進行推理和訓練 - Falcon和LLaMA都沒有這個,”他說?!耙虼耍瑥挠嬎愕慕嵌葋砜?,我們的方法實際上效率更高。

Rao補充說,新模型更適合企業使用,因為它“大小合適”以“適應實際硬件的限制”。他指出,深度學習GPU通常使用40-80千兆字節的內存。根據Rao的說法,開源的Falcon LLM正在與這種限制作斗爭。

“奇怪的是,他們發布的獵鷹模型是一個400億參數模型。這不太適合 80 GB GPU,因為它正好靠在邊緣。

他補充說,它自己的300億個參數模型更小,以便更好地針對GPU進行優化?!八]有真正損害我們的性能,它將讓你非常輕松地適應80-gGPU,”他說。

Rao聲稱其新的30B參數模型在性能上也優于LLaMA和Falcon。

“由于我們的效率方法,我們實際上訓練的計算比LLaMA和Falcon少。所以訓練實際上要便宜得多。但我們基本上是平價的。這取決于評估指標——比如,對于編碼,這個模型實際上比這兩個模型做得更好。在其他事情上,情況更糟。

當然,LLaMA和Falcon背后的人可能會對此提出異議。但是很難獨立驗證MosaicML的說法,因為Rao談到的三個開源LLM項目(MosaicML,LLaMA或Falcon)都沒有使用斯坦福大學的HELM措施進行測試。

MosaicML vs. OpenAI

那么MosaicML的模型與OpenAI的GPT-4相比如何呢?Rao 承認 GPT-4 在大多數方面的能力方面都更勝一籌。然而,他重申,MosaicML的模型提供了更長的上下文長度,這允許獨特的用例 - 例如生成F. Scott Fitzgerald的著名小說“了不起的蓋茨比”的尾聲。(題外話:作為一名前英國文學專業的學生,這是我最不想從法學碩士那里得到的東西!

Rao說,像GPT-4這樣的大型模型的主要挑戰是運行它們的高成本,這使得大多數企業都不切實際。MosaicML還專注于為具有特定數據(包括敏感數據)的公司提供服務,以微調其特定行業的模型。

在用例方面,Rao解釋說,醫療保健和銀行業等行業可以從MosaicML解釋和匯總大量數據的能力中受益。例如,在醫學領域,該模型可以解釋實驗室結果,并通過分析各種輸入來提供對患者病史的見解。

Rao強調了開源模型在這些場景中的重要性,因為健康(或實際上是財務)數據的本質需要在防火墻后面進行安全處理,而不是通過API將其發送給OpenAI之類的公司。

開發人員如何使用 MosaicML

我問開發人員如何開始使用MosaicML的平臺。Rao回答說,MosaicML提供了各種選擇,具體取決于開發人員的需求和專業知識。對于簡單的集成,他們提供了一個類似于其他公司(如OpenAI)的API,允許開發人員輕松地將MosaicML的模型整合到他們的前端應用程序中。他聲稱,與其他提供商的類似規模的模型相比,MosaicML的模型更具成本效益。

開發人員還可以選擇通過使用自己的數據對其進行微調來自定義 MosaicML 模型。他們可以下載模型、進行修改,并使用自定義版本創建自己的 API。

對于擁有大量數據的高級開發人員,Rao表示,MosaicML的工具可用于從頭開始預訓練自定義模型,并使用MosaicML的平臺為它們提供服務。

然后我問了MosaicML與流行的第三方工具(如LangChain)的兼容性。

“你通過LangChain獲得的所有工具都可以與我們的API一起使用,”他回答道。“真正酷的是,您可以在與我們一起構建的自定義模型之上使用這些工具。因此,我們基本上在定制方面為開發人員提供了令人難以置信的能力——甚至擁有整個模型。您進入該模型的所有數據(權重,所有內容)都歸您所有,因此可以完全自定義。這就是我們實現的目標。有了這些API提供商(如OpenAI),你得到的是你所得到的——零定制。

團隊開源

盡管在我們的采訪中談到了LLaMA和Falcon,但最終Rao認為他們都在同一個團隊中 - 而像OpenAI這樣的專有平臺才是真正的競爭對手。

“這使權力回到了企業開發人員手中,”他說,關于開源LLM,“將所有這些放在一個集中的地方,在那里你可以得到你得到的東西,這是一個很大的負面結果。

他還堅持認為,開源LLM正在“縮小與這些閉源模型的差距”。他承認,也許還沒有完全,但他認為開放的LLM已經“跨越了這些模型實際上非常有用的門檻”。

MosaicML推出30B模型 - 接受LLaMA,Falcon和GPT的帖子首先出現在The New Stack上。

關鍵詞:

相關閱讀

久久精品123,午夜国产欧美理论在线播放,国产精品影视天天线,国内自拍亚洲
久久久久国产精品一区二区| 欧美婷婷六月丁香综合色| 国产精品xvideos88| 国产精品三级视频| 久久精品人人做人人爽电影蜜月| 一区二区三区日韩欧美| 国语精品中文字幕| 久久av资源网站| 亚洲欧美激情视频在线观看一区二区三区| 欧美一级电影久久| av成人免费在线观看| 国内视频一区| 亚洲国产日韩综合一区| 欧美精品在线视频观看| 欧美粗暴jizz性欧美20| 亚洲午夜激情网站| 欧美在线在线| 久久精品二区亚洲w码| 一片黄亚洲嫩模| 国产精品v欧美精品v日韩精品| 亚洲毛片在线观看| 国产精品久久999| 狠狠色2019综合网| 久久动漫亚洲| 久色成人在线| 国产乱子伦一区二区三区国色天香| 伊人久久成人| 黄色成人av| 亚洲欧美日韩爽爽影院| 亚洲免费成人av电影| 亚洲精品国产精品国自产观看浪潮| 国产欧美一二三区| 国产一二三精品| 性色一区二区| 亚洲综合首页| 欧美亚洲一级片| 亚洲激情视频在线播放| 国产专区综合网| 欧美日韩在线播放三区| 久久久久久久久久久久久女国产乱| 国产欧美二区| 国产精品欧美经典| 麻豆精品一区二区综合av| 欧美日韩三级在线| 国产精品久久久久久模特| 国产喷白浆一区二区三区| 久久免费国产| 在线观看中文字幕不卡| 欧美日本一道本在线视频| 欧美激情网站在线观看| 亚洲欧美成人综合| 国产欧美日韩一区| 精东粉嫩av免费一区二区三区| 久久国产精品99国产| 亚洲卡通欧美制服中文| 免费日韩一区二区| 日韩一级大片在线| 欧美a级理论片| 欧美激情精品久久久久久变态| 欧美男人的天堂| 久久av二区| 久久久久久久网| 红桃视频亚洲| 樱桃成人精品视频在线播放| 欧美一区激情视频在线观看| 欧美一区二区三区免费视| 亚洲欧美日韩在线观看a三区| 亚洲欧美综合精品久久成人| 国产精品高清免费在线观看| 制服诱惑一区二区| 欧美视频你懂的| 精品不卡在线| 极品中文字幕一区| 国产精品久久久久9999高清| 久热精品视频在线| 性色av一区二区三区在线观看| 国产一区二区三区av电影| 欧美成人精品影院| 午夜亚洲激情| 国产日韩欧美麻豆| 久久综合精品国产一区二区三区| 久热精品在线视频| 欧美国产在线观看| 一本到12不卡视频在线dvd| 国产毛片精品国产一区二区三区| 亚洲精品一区二区三区蜜桃久| 亚洲激情视频网| 国产一区二区久久| 欧美一级久久久久久久大片| 亚洲大胆av| 亚洲一区二区欧美日韩| 宅男噜噜噜66国产日韩在线观看| 一区精品在线播放| 国产精品一区二区视频| 久久精品理论片| 免费亚洲婷婷| 国产精品无人区| 极品尤物久久久av免费看| 国产欧美精品日韩| 亚洲精品久久久蜜桃| 99re成人精品视频| 欧美午夜在线观看| 国产精品国产亚洲精品看不卡15| 六十路精品视频| 欧美va天堂| 亚洲精品免费看| 韩国久久久久| 日韩午夜在线| 性欧美暴力猛交另类hd| 欧美日韩在线大尺度| 这里只有精品丝袜| 亚洲区欧美区| 狠狠干成人综合网| 黄色成人免费网站| 久久精品欧美日韩精品| 在线免费观看日韩欧美| 一本不卡影院| 伊人精品视频| 亚洲精品国产精品国自产观看| 欧美成人资源网| 亚洲激情中文1区| 亚洲国产综合在线看不卡| 欧美日韩成人综合在线一区二区| 欧美视频第二页| 欧美成人精品h版在线观看| 免费在线亚洲| 99人久久精品视频最新地址| 国产午夜精品理论片a级大结局| 欧美/亚洲一区| 在线观看国产精品淫| 日韩午夜免费视频| 欧美成人免费一级人片100| 亚洲精品乱码久久久久久黑人| 欧美国产日韩精品免费观看| 在线观看欧美激情| 欧美日韩黄色大片| 国产夜色精品一区二区av| 欧美区一区二区三区| 亚洲欧美国产精品专区久久| 久久久99精品免费观看不卡| 久久精品国产99国产精品澳门| 国产啪精品视频| 欧美91福利在线观看| 在线一区免费观看| 亚洲人人精品| 亚洲高清视频在线| 亚洲午夜一区二区三区| 亚洲免费观看在线视频| 亚洲精品乱码久久久久久蜜桃91| 亚洲午夜久久久久久久久电影网| 有码中文亚洲精品| 欧美激情久久久久| 欧美国产日韩a欧美在线观看| 亚洲精品日韩综合观看成人91| 欧美成人网在线| 欧美/亚洲一区| 欧美色另类天堂2015| 亚洲一区图片| 免费在线欧美视频| 久久成人一区| 国产乱码精品一区二区三区av| 国产一区二区日韩精品欧美精品| 亚洲国产一区二区三区青草影视| 国内精品久久久久久久影视蜜臀| 国内精品99| 欧美日韩精品欧美日韩精品一| 六十路精品视频| 欧美日韩卡一卡二| 久久躁狠狠躁夜夜爽| 国产欧美日韩综合| 亚洲日韩欧美一区二区在线| 国产精品捆绑调教| 欧美二区在线观看| 亚洲一区二区三区精品在线| 裸体女人亚洲精品一区| 国产精品国产a级| 国产精品久久久久久久久久免费| 欧美激情一区| 亚洲激情第一页| 国产精品一区二区欧美| 1204国产成人精品视频| 久久久天天操| 欧美午夜精品久久久久久浪潮| 老妇喷水一区二区三区| 国产精品久久久久9999吃药| 久久精品欧洲| 欧美精品粉嫩高潮一区二区| 欧美一区二区在线视频| 性色av香蕉一区二区| 亚洲福利在线观看| 好吊色欧美一区二区三区四区| 性做久久久久久久免费看| 国产美女一区二区| 尤物99国产成人精品视频| 国产精品男gay被猛男狂揉视频| 亚洲一区二区三区在线播放| 国产日韩欧美日韩| 亚洲国产va精品久久久不卡综合| 在线视频日韩| 国精产品99永久一区一区|