2019年1月27日 星期日

AI 深度學習:工作後的學術資源總整理

 

這篇文章整理了我自己工作之後,如何繼續保持與學術資源聯繫、持續精進的方法,enjoy it!

(圖:OpenAI blog)




一、學術搜尋與下載


畢業後使用學校網絡的門檻變高,使得學術資料的收集較不方便。我現在大部分閱讀的論文都是用 Google Scholar 搜尋之後找 arXiv 下載,大部分 computer science 的論文都可以在這找到,而且全是免費,真是窮人福音!

1. Google Scholar http://scholar.google.com/



Google Scholar 是 Google 於 2004 年 11 月推出的學術搜索服務,以 google 作搜尋引擎的經驗,做學術搜尋還是很值得信任的。一般來說學術文獻蒐尋分成下面兩個場景:

  1. 查詢已知標題的文章 (或是使用已知的 DOI、作者、期刊名稱)
  2. 用關鍵字蒐羅某主題的文章

由 Google Scholar 搜尋到的文章可能只是網站連結,還需要進去確認是否為免費下載。


2. arXiv https://arxiv.org/



arXiv.org (讀音如英語 archive) 是一個當前最流行的線上預印本資料庫,由物理學家 Paul Ginsparg 在 1991 所創立,旨在為研究者提供一個在正式同儕互評前的預印本分享平台。最初只收集物理學的論文預印本,隨後擴及數學、計算機、計量經融等其它領域。目前,該系統由美國康乃爾大學 arXiv 團隊維護,提供全球使用者免費搜尋及下載預印本,目前收藏的論文篇數大約 150 萬篇 (2019)。

優點:

  • 打破出版商的壟斷和昂貴訂閱費用,讓知識傳播更容易。
  • 提早展示自己的研究成果,證明論文原創性 (上傳時間戳記)。 
  • 提早取得同儕的評論意見,做為改善方向。
  • 打破學界和社會大眾的籓籬:更公開、更透明。

缺點:

  • 沒有審查機制,難以確保品質。
  • 使用 pdf 和 latex,文本分析難度較高。




二、學術頂級會議


在 CV / DL / AI 領域,頂級會議 (top conference) 是發表重大研究成果的主要方式,而不是期刊 (journals),因此要追 state-of-the-art 的成果也以頂級會議的 paper 為主。當然以不同的地區 (歐洲、美洲、亞洲) 或各個研究領域看待不同的會議可能排名會稍有不同,但基本上來說,想上頂級會議還是非常困難的。

下面是目前 (2019) 一些著名的頂級會議整理:

1. Machine Learning


  • ICML: International Conference on Machine Learning
  • NIPS: Conference and Workshop on Neural Information Processing Systems (NeurIPS)
  • ICLR: International Conference on Learning Representations
  • COLT: Computational Learning Theory
  • UAI: Uncertainty in Artificial Intelligence
  • AISTATS: Artificial Intelligence and Statistics

我自己比較常看前 3 個,ICML 和 NIPS 都是老牌的會議,公認的 tier 1,而 ICLR 是由於近年來深度學習大師們大力拉拔而水平急速上升,而 COLT 是重理論的會議,UAI 和 AISTATS 則是重機率統計的會議。


2. Computer Vision


  • ICCV: International Conference on Computer Vision 
  • CVPR: International Conference on Computer Vision and Pattern Recognition  
  • ECCV: European Conference on Computer Vision

以計算機視覺領域來說,ICCV、CVPR 和 ECCV 是 CV 領域的三大會議。ICCV 兩年舉辦一次 (奇數年),與 ECCV 剛好錯開,ECCV 在歐洲舉辦,CVPR 則是每年在美國舉辦。


3. Data Mining


  • SIGIR: ACM Special Interest Group (SIG) on Information Retrieval
  • SIGKDD: ACM Special Interest Group (SIG) on Knowledge Discovery and Data Mining
  • WWW: The Web Conference

SIG 是 ACM 下的興趣小組 (Special Interests Group),很多 ACM 的興趣小組的會議,就會以 SIG-[name] 稱呼,在這裡分別是 Information Retrieval 和 Data mining。


4. Artificial Intelligence


  • AAAI:American Association for Artificial Intelligence
  • IJCAI:International Joint Conference on Artificial Intelligence

一樣是兩個老牌會議,但感覺大家在討論 ML 時覺得 AAAI 和 IJCAI 沒這麼頂尖,不過在 AI 領域應當還是翹楚。




三、知名科技公司部落格


最後是一些科技大廠的 research blog,通俗易懂又有頂級研究背書,是一個滿適合了解學術和產業現況的地方。



Google AI blog
https://ai.googleblog.com/

Deepmind blog
https://deepmind.com/blog/

Facebook AI Research
https://research.fb.com/category/facebook-ai-research/

Microsoft AI Blog
https://blogs.microsoft.com/ai/

Amazon AI
https://blog.aboutamazon.com/amazon-ai

AWS Machine Learning Blog
https://aws.amazon.com/tw/blogs/machine-learning/

Apple Machine Learning Journal
https://machinelearning.apple.com/

NVIDIA News AI
https://news.developer.nvidia.com/category/artificial-intelligence/

OpenAI Research
https://openai.com/research/



最後,還是給自己一點期許:少看天花亂墜的 AI 內容農場,捲起袖子努力算數學、寫程式,才能做出優質的 AI 專案!




References


Alberto Pepe, Matteo Cantiello, Josh Nicholson - The arXiv of the future will not look like the arXiv
https://www.authorea.com/users/3/articles/173764-the-arxiv-of-the-future-will-not-look-like-the-arxiv

計算機視覺三大頂級國際會議
http://www.sigvc.org/bbs/thread-59-1-1.html

roadu - 為什麽不去讀頂級會議上的論文?適應於機器學習、計算機視覺和人工智能
http://muchong.com/html/201012/2659795.html

知乎
https://www.zhihu.com/

AI會議排名_周志華
http://blog.sina.com.cn/s/blog_631a4cc40100xl7d.html





技術提供:Blogger.