構建生產機器學習系統的一些考慮

2020-02-02T09:57:18+00:00

既然你的公司已經決定ML是一個必要的下一步,那麼作為一個ML工程師,現在是時候考慮為生產系統構建ML過程的真正內容了。

Netflix中的插圖個性化

2020-06-14T12:51:21+00:00

在給用戶做推薦的時候,推薦什麼內容固然非常重要,然而在有些場景下,同樣的內容,採取什麼方式給用戶進行推薦也會影響用戶的選擇,這篇文章中,Netflix使用不同插圖為用戶推薦相同的內容,在實際應用中很有借鑑意義。

5個步驟部署你的機器學習模型到生產中

2019-12-23T01:05:07+00:00

作者:Rahul Agarwal編譯:ronghuaiyang導讀為什麼我們的機器學習項目會失敗?創造一個大的機器學習系統是一門藝術。在構建一個大的機器學習系統時,有很多事情需要考慮。但作為數據科學家,我們常常只擔心項目的某些部分。

12個現實世界中的機器學習真相

2020-01-14T04:18:06+00:00

GeorgeA. Hazelrigg 在他的「HONING YOUR PROPOSAL WRITING SKILLS」中寫道:一些科學家會學習如何制定研究計劃。

正確的debug你的TensorFlow代碼(不用這麼痛苦)

2019-12-19T07:43:15+00:00

作者:Galina Olejnik編譯:ronghuaiyang導讀TensorFlow代碼很難調試,這個大家已達成共識,不過,就算是難,也還是需要調試的,畢竟誰也沒有把握不出bug,看看這篇文章能不能讓你減輕一點調試時的痛苦。

構建神經網絡的一些實戰經驗和建議

2019-12-19T07:30:46+00:00

作者:Matt H and Daniel R編譯:ronghuaiyang導讀從成千上萬小時的模型訓練中累計的經驗和教訓。在我們的機器學習實驗室,我們在許多高性能的機器已經積累了成千上萬個小時的訓練。

構建神經網絡的一些實戰經驗和建議

2019-12-19T07:30:46+00:00

作者:Matt H and Daniel R編譯:ronghuaiyang導讀從成千上萬小時的模型訓練中累計的經驗和教訓。在我們的機器學習實驗室,我們在許多高性能的機器已經積累了成千上萬個小時的訓練。

Instagram的Explore智能推薦系統

2019-12-23T08:46:06+00:00

正在進行的ML 挑戰構建 Explore 最令人興奮的部分之一,就是不斷尋找新的、有趣的方式,幫助我們的群體在 Instagram 上發現最有趣、最相關的內容。

Instagram的Explore智能推薦系統

2019-12-23T08:46:10+00:00

正在進行的ML 挑戰構建 Explore 最令人興奮的部分之一,就是不斷尋找新的、有趣的方式,幫助我們的群體在 Instagram 上發現最有趣、最相關的內容。

新的深度學習優化器Ranger:RAdam + LookAhead強強結合

2019-12-30T15:28:03+00:00

我發現,通過結合這兩個,RAdam+ LookAhead,產生了一個增強的優化器,並在 ImageNette 驗證了運行 20 個 epoch 分數的新高。

全球首款量產L4級自動駕駛無人車投放千燈湖AI公園!市民預約即可體驗

2019-12-30T05:14:25+00:00

本次首期在千燈湖公園投放3台全球首款量產的L4 級自動駕駛無人車——百度阿波龍無人車,包括無人駕駛微循環電動小巴車和充電樁、基站等配套技術設施,把千燈湖打造成集科技、市民娛樂和互動體驗於一體的AI智慧公園,讓市民享受看得見、摸得著的先進AI技術。

亞馬遜暢銷書的NLP分析——推薦系統、評論分類和主題建模

2020-01-18T01:21:04+00:00

雖然我們在情感分析和主題建模中使用的數據集有超過80000 個數據點,在推薦系統中的數據集有超過 100 萬個數據點,但是前一個數據集只覆蓋了前 20 名的暢銷書,後一個數據集覆蓋了前 2000 名的書。

部署基於嵌入的機器學習模型的通用模式

2020-01-31T08:56:51+00:00

由於最近大量的研究,機器學習模型的性能在過去幾年裡有了顯著的提高。雖然這些改進的模型開闢了新的可能性,但是它們只有在可以部署到生產應用中時才開始提供真正的價值。

2020年圖機器學習的最新趨勢

2020-02-11T07:33:57+00:00

A Dissection on Graph Classification,Chen等人表明,如果用線性部分來取代非線性鄰域聚合函數,其中包括鄰居的度和圖屬性的傳播,那麼模型的性能不會降低,— 這與前面的說法一致,即許多圖數據集對於分類來說都是不重要的,並且為這個任務提出了適當的驗

2020年圖機器學習的最新趨勢

2020-02-11T07:33:59+00:00

A Dissection on Graph Classification,Chen等人表明,如果用線性部分來取代非線性鄰域聚合函數,其中包括鄰居的度和圖屬性的傳播,那麼模型的性能不會降低,— 這與前面的說法一致,即許多圖數據集對於分類來說都是不重要的,並且為這個任務提出了適當的驗

LinkedIn招聘推薦系統中的機器學習的威力

2020-02-12T04:51:48+00:00

具體來說,LinkedIn招聘系統是一款幫助招聘人員建立和管理人才庫的產品,可以優化成功招聘的機會。

千燈湖AI公園啟動!自動駕駛無人車元旦正式運營

2019-12-31T18:40:12+00:00

更多精彩資訊,下載 暢駕 客戶端一起耍吧千燈湖AI公園正式啟動百度阿波龍無人車亮相元旦起,南海市民就可以免費體驗啦12月30日,千燈湖AI公園啟動儀式在千湖公園(三期)日出廣場舉行。

LinkedIn招聘推薦系統中的機器學習的威力

2020-02-12T04:30:46+00:00

具體來說,LinkedIn招聘系統是一款幫助招聘人員建立和管理人才庫的產品,可以優化成功招聘的機會。

如何高效的做機器學習項目

2020-02-07T14:28:44+00:00

我做了一點心路探索,回到了fast.ai的MOOC課程JeremyHoward在Practical Deep Learning for Coders提到的內容,然後這篇文章就誕生了。

關於機器學習,我們忽視的東西

2020-01-16T20:21:19+00:00

在我看來,這就像今天社區的普遍分裂—— 50%的人認為人工智慧是我們的未來,50%的人認為它是我們的末日。很明顯,C1一開始並不是很準確,但是隨著攻擊強度的增加,它在抵抗攻擊方面也做得更好。

使用Cortex把PyTorch模型部署到生產中

2020-01-21T20:31:59+00:00

fastText是這個任務的完美模型,你可以使用 PyTorch 和 Cortex 部署它。PyTorch 用到生產中有超過 25 個研究模型儲存在 PyTorch Hub],從 NLP 到計算機視覺。

4個步驟成功構建出一個機器學習團隊

2020-02-20T13:28:18+00:00

作者:JamesLe編譯:ronghuaiyang導讀對一個公司來說,如何從0到1構建一個機器學習團隊,是很多公司非常頭疼的問題,這篇文章給出了一些建議,對求職者來說,同樣具有參考價值。

亞馬遜暢銷書的NLP分析——推薦系統、評論分類和主題建模

2020-01-18T21:36:57+00:00

雖然我們在情感分析和主題建模中使用的數據集有超過80000 個數據點,在推薦系統中的數據集有超過 100 萬個數據點,但是前一個數據集只覆蓋了前 20 名的暢銷書,後一個數據集覆蓋了前 2000 名的書。

新的深度學習優化器Ranger:RAdam + LookAhead強強結合

2019-12-30T15:28:14+00:00

我發現,通過結合這兩個,RAdam+ LookAhead,產生了一個增強的優化器,並在 ImageNette 驗證了運行 20 個 epoch 分數的新高。

Netflix:使用A/B測試來找到最佳的插圖

2020-06-15T14:23:33+00:00

上回的文章中提到了使用A/B測試來找到最佳插圖的工作,今天找到了這篇文章給大家分享一下,不得不感嘆一下,Netflix對A/B測試的使用已經不僅僅是評估新算法的表現那麼簡單了。

5個步驟部署你的機器學習模型到生產中

2019-12-23T01:05:16+00:00

作者:Rahul Agarwal編譯:ronghuaiyang導讀為什麼我們的機器學習項目會失敗?創造一個大的機器學習系統是一門藝術。在構建一個大的機器學習系統時,有很多事情需要考慮。但作為數據科學家,我們常常只擔心項目的某些部分。

酒店排名模型中的商業價值度量

2020-02-03T17:49:07+00:00

在RocketTravel酒店排名系列的下一篇中,我們將解釋為什麼我們更喜歡一種名為LambdaMART的信息檢索模型,而不是用於排名的標準推薦系統模型。

Transformers是一種圖神經網絡

2020-07-02T23:55:13+00:00

通過這篇文章,我想在Graph Neural Networks 和transformer之間建立聯繫。我會討論NLP和GNN社區中,模型架構背後的直覺,使用方程和圖把這兩者建立聯繫,並討論如何把這兩個放到一起工作來得到進展。

使用嵌入來做個性化的搜索推薦:來自Airbnb

2020-06-14T03:57:48+00:00

這是Airbnb的一篇經典文章的解讀,使用房屋的嵌入來做搜索推薦,這篇文章也是KDD2018的best paper,思路很清楚:把房屋用嵌入向量來表示,兩個技巧:全局正樣本和市場內負採樣,很有效,離線評估指標:預定前的平均點擊數量,非常的貼近業務。

來自AI專家的13篇必讀論文

2020-06-13T07:06:31+00:00

Efficient Incremental Learning for Mobile Object Detection - Dawei Li et al。