7個登上熱榜的 GitHub 開源項目

echa攻城獅 發佈 2024-01-09T01:55:26.096483+00:00

最近組織安排小編翻山越嶺跨省出差,連續斷更了2天創作,感覺錯過了好多美好的東西。小編今天給大家分享7個登上熱榜的 GitHub 開源項目,希望給友友們學習有所幫助。

大家好,我是Echa。

最近組織安排小編翻山越嶺跨省出差,連續斷更了2天創作,感覺錯過了好多美好的東西。說實話出差長途還是比較累。想友友你們了,第一時間打開頭條,發現好多友友私信小編,有的友友問小編還好嗎?有的問小編咋不更新內容了?平時看你每日一更,突然沒更新好文章內容有點不習慣,有的友友諮詢小編私信怎麼不回信息了等等,在這裡非常感謝友友們對小編的關心和愛戴。

小編今天給大家分享7個登上熱榜的 GitHub 開源項目,希望給友友們學習有所幫助。有空還是可以去研究研究,提升自身的技術廣度。

全文大綱

  1. MiniGPT-4 迷你的GPT4
  2. Twitter 算法開源
  3. OpenAssistant 全球最大的 ChatGPT 開源替代品
  4. iPERCore 人體運動模仿算法
  5. ChatGPT_JCM -OpenAI管理界面
  6. chatgpt-mirai-qq-bot 基於 ChatGPT 的 QQ 機器人
  7. AnimatedDrawings 一款非常有趣的 AI 工具

MiniGPT-4 迷你的GPT4

Github:https://github.com/Vision-CAIR/MiniGPT-4

MiniGPT-4是一個具有圖像理解能力的開源聊天機器人,基於+Vicuna-13B+LLM+和+BLIP-2視覺語言模型。研究團隊首先在四張+Nvidia+A100顯卡上用大約500萬對圖像文本對+MiniGPT-4進行了十個小時的訓練。構建聊天生態系統更具挑戰性且在經濟上不可持續,但會對用戶產生強烈的鎖定效應。

相比ChatGPT,GPT-4展示出了非凡的多模態能力,它可以利用手寫文本生成網站並且還能夠識別出圖片中的幽默元素。這些優秀的能力在以前的視覺語言模型中很難實現。**對於GPT-4驚人的多模態生成能力,其主要原因是使用了更先進的大型語言模型 (LLM)**。那麼能否利用目前比較先進的大型LLM進行微調從而儘可能達到GPT-4的性能呢?那麼今天給大家分享的這篇文章就從該角度出發,提出了MiniGPT-4,該模型在文本方面可以達到90% ChatGPT的能力,在視覺感知方面,同樣具備與GPT-4的多模態功能。

項目作者認為,GPT-4 所實現的多模態能力,在以前的視覺 - 語言模型中很少見,因此認為,GPT-4 先進的多模態生成能力,主要原因在於利用了更先進的大型語言模型。

為了驗證這一想法,團隊成員將一個凍結的視覺編碼器與一個凍結的 Vicuna 進行對齊,造出了 MiniGPT-4。


在MiniGPT-4訓練階段,作者提出了一種兩階段訓練方法。在第一階段,因為在大量對齊的圖像-文本對上對進行模型預訓練,以獲取視覺語言知識。在第二階段,使用較小但高質量的圖像文本數據集對預訓練模型進行微調,以增強模型的生成可靠性和可用性。

實驗結果,發現 MiniGPT-4 擁有許多類似於 GPT-4 所展示的功能。 例如,MiniGPT-4 可以生成複雜的圖像描述,根據手寫文本指令創建網站,以及解釋不尋常的視覺現象。

如下圖:






Twitter 算法

Github:https://github.com/twitter/the-algorithm

2023年4月1號 埃隆·馬斯克在個人Twitter上轉發了其在GitHub開源Twitter的推薦算法。馬斯克表示通過公開這些算法,來提昇平台的透明度、增強用戶、客戶和媒體的信任。


馬斯克履行諾言, Twitter 推薦算法開源了,該開源項目涵蓋了推薦算法在內的許多推特原始碼,包括用來控制用戶在 For You 時間線上看到的推文的機制。

總的來說,Twitter的推薦算法是一個個性化推薦系統,主要運作在Twitter用戶的「For You」界面。其每天會將約5億條推文精簡到1500條,再進一步篩選後推薦到不同用戶的「For You」信息流上。

這個系統會預測用戶最有可能與哪些用戶互動,並且判斷Twitter上有哪些熱門的「社區」和推文。

這個系統如何判斷以上的問題?主要通過兩部分的數據:

  1. --用來訓練機器學習模型的基礎數據:即Twitter的大規模專有數據,包括用戶數據、關注數據、推文內容數據以及互動數據等。
  2. --在為推文相關性打分時使用的排名信息:即用戶偏好、歷史行為和時間因素等。

要完成從5億到1500的「精簡」過程並不簡單,共分為三個階段:

  • 候選源採集:從不同的推薦源獲取最好的推文
  • 推文排名:使用機器學習模型對每條推文進行排名
  • 過濾篩選:應用啟發式算法和過濾器,過濾掉用戶屏蔽、不適合公開瀏覽以及已經瀏覽過的內容

其主要分為三個模塊:

  • DATA。數據部分主要是三大塊:用戶、推文、社交網絡。
  • FEATRUE。特徵部分除了計算用戶和推文的特徵外,社交圖中的社區發現特徵等十分重要,另外還有一些信用和安全的特徵。
  • HOME MIXER。執行推薦的整個服務,基於scala,執行推文召回、粗/精排序、重/混排

最後實現Timeline、Who to follow、Ads的三個任務,即給用戶推文、推用戶、推廣告

具體如下圖:





OpenAssistant 全球最大的 ChatGPT 開源替代品

官網地址:https://open-assistant.io

Github:https://github.com/LAION-AI/Open-Assistant

2023年4月12日,Github上的熱門話題是Open Assistant (簡稱 OA) ,它是由 LAION-AI 開發的基於聊天的開源助手。該項目的願景是創建一個可以在單個高端消費類 GPU 上運行的大型語言模型。通過些修改,Open Assistant 還應該能夠輕鬆地與其他第=方應用程式交萬,以及從資料庫和Internet 檢索信息

Open Assistant 是一個旨在讓每個人都能訪問基於聊天的大型語言模型的項目,可以理解任務並與第三方系統交互。它可以動態檢索信息來完成這些任務。該助手還被設計為易於擴展和個性化,並作為免費的 開源軟體Q開發,支持 35 種語言。

特性

  • 簡單易用:Open Assistant提供了豐富的功能和工具,並且採用了簡單的API接口,使得用戶可以輕鬆地構建和定製自己的助理系統,無需深入了解複雜的技術細節。
  • 多功能支持:Open Assistant支持多種功能,包括語音識別、自然語言處理、對話管理、任務執行等,可以用於構建不同領域的語音助手、智能對話系統、自動客服等應用。
  • 開放原始碼:Open Assistant是一個完全開源的項目,原始碼託管在GitHub上,用戶可以自由訪問、使用、修改和分享,從而促進了項目的持續發展和社區的共享合作。
  • 靈活定製:Open Assistant支持用戶自定義對話流程、任務執行和響應策略,可以根據用戶的需求進行靈活定製,實現個性化的助理系統。
  • 大型社區支持:Open Assistant項目由LAION-AI團隊維護,並且在GitHub上擁有一個活躍的社區,用戶可以通過社區獲得支持、參與討論和分享經驗,從而加速項目的發展和改進。

我們相信,通過這樣做,我們將在語言創新方面掀起一場革命。就像穩定擴散幫助世界以新方式製作藝術和圖像一樣,我們希望 Open Assistant 可以通過改進語言本身來幫助改善世界。

Open Assistant 機器學習模型是由一家德國非營利組織 LAION 運營。近日,該組織官宣現在可以使用 OpenAssistant 模型、訓練數據和代碼,並將該模型稱之為-全球最大的 ChatGPT 開源複製品

OpenAssistant Conversations 數據集是通過 13000 多名志願者的眾包努力綜合而來的。

這些數據是通過一個網絡應用程式界面收集的,該界面將數據分為五個單獨的步驟來收集:

  • 提示、標記提示、添加回復消息作為提示或助理、標記回復以及對助理回復進行排序。
  • 可以看到,這一數據集中最常用語言的占比,英語和西班牙語占比最多。中文 2.5%。


為了評估 OpenAssistant Conversations 數據集的有效性,研究者基於 Pythia 和 LLaMA 模型微調了一下 OpenAssistant 模型。

其中,包括指令調優的 Pythia-12B、LLaMA-13B 和 LLaMA-30B。在接下來的評估中,研究人員主要評估了 Pythia-12B 模型的性能。

與 ChatGPT 對打

為了評估 Pythia-12B 的性能,研究人員進行了一項用戶偏好研究,將其輸出與 gpt-3.5-turbo 模型的輸出進行比較。

研究顯示,OpenAssistant 的回覆與 gpt-3.5-turbo(ChatGPT)的相對偏好率分別為 48.3% 和 51.7%。

行與不行,都得拉出來遛遛才知道。





iPERCore 人體運動模仿算法

Github:https://github.com/iPERDance/iPERCore

iPERCore 是人體運動模仿、外觀遷移和新視圖合成算法。只要輸入一張照片、一段視頻,就能讓川普跟著明星偶像「唱、跳、Rap」!

給定一張或者多張人物 A 的圖像,和一段人物 B 的視頻,就可以通過動作遷移算法自動合成一段人物 A 做任務 B 動作的視頻

看看阿川老師模仿阿坤老師等人的舞姿:





ChatGPT_JCM -OpenAI管理界面

Github:https://github.com/202252197/ChatGPT_JCM

OpenAI管理界面,聚合了OpenAI的所有接口進行界面操作(所有模型、圖片、音頻、微調、文件)等,支持Markdown格式(公式、圖表,表格)等

OpenAI 基於 BSD-3-Clause license 協議,免費且作為開源學習使用。並且不會有任何形式的賣號、付費服務、賣key等行為。謹防受騙。 項目使用Vue2進行開發,給大家提供一個方便使用的OpenAI web 管理界面,有好的建議和bug歡迎大家提出來,項目會一直開源和代碼優化,方便對openai進行入門了解使用,後期會接入後端,實現更豐富的功能。

如下圖:









chatgpt-mirai-qq-bot

官網:https://chatgpt-qq.lss233.com/

Github:https://github.com/lss233/chatgpt-mirai-qq-bot

一鍵部署!真正的 AI 聊天機器人!支持ChatGPT、文心一言、Bing、Bard、ChatGLM、POE,多帳號,人設調教,虛擬女僕、圖片渲染、語音發送 | 支持 QQ、Telegram、Discord 等平台


特性

  • 圖片發送
  • 關鍵詞觸發回復
  • 多帳號支持
  • 百度雲內容審核
  • 額度限制
  • 人格設定
  • 支持 Mirai、 go-cqhttp、 Telegram、Discord
  • 可作為 HTTP 服務端提供 Web API
  • 支持 ChatGPT 網頁版
  • 支持 ChatGPT Plus
  • 支持 ChatGPT API
  • 支持 Bing 聊天
  • 支持 Google bard
  • 支持 poe.com 網頁版
  • 支持 文心一言 網頁版
  • 支持 ChatGLM-6B 本地版

具體如下圖:




AnimatedDrawings

Github:https://github.com/Facebookresearch/AnimatedDrawings

2021 年的時候,Meta(前身是 Facebook)團隊發布了一款非常有趣的 AI 工具,叫 Animated Drawings,它的牛逼之處,在於能藉助人工智慧技術,讓兒童繪畫作品動起來。

Animated Drawings 這款應用是個在線的演示項目,只需要上傳孩子的塗鴉人物就可以輕鬆轉變成好玩的動畫片。兒童繪畫具有奇妙的創造力,活力和多樣性。我們專注於他們繪製的人物圖中所有多樣性的後果,因為我們開發了一種算法,通過自動動畫將它們變為現實。它允許父母或監護人將兒童繪畫轉換為 33 種類型的動畫,讓卡通人物動起來、跑起來、跳起來,非常有趣。

不久前,Meta 團隊正式將論文中的算法實現開源到了 GitHub,短短几天,項目 Star 數便突破 3100+,增長頗為迅猛。


最後

一台電腦,一個鍵盤,盡情揮灑智慧的人生;幾行數字,幾個字母,認真編寫生活的美好;

一 個靈感,一段程序,推動科技進步,促進社會發展。

創作不易,喜歡的老鐵們加個關注,點個讚,打個賞,後面會不定期更新乾貨和技術相關的資訊,速速收藏,謝謝!你們的一個小小舉動就是對小編的認可,更是創作的動力。

關鍵字: