《電子技術(shù)應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 業(yè)界動態(tài) > 深度學習(計算機視覺方向)入門的一些建議

深度學習(計算機視覺方向)入門的一些建議

2019-09-29
關(guān)鍵詞: 計算機 計算機視覺

t01800be05c5013ed95.jpg

  從研一入學到現(xiàn)在剛好一年了,剛?cè)雽W的時候?qū)@方面是一點也不懂,那時實驗室的沒有GPU的電腦還以為很強,哈哈。即使現(xiàn)在,我也不敢說有多懂,只是把我這將近一年學到的過程分享一下,如果有需要的朋友們可以參考看一下,也可能有許多錯誤的地方,希望大家?guī)臀抑刚鰜硪黄鹛岣摺?/p>

  我記得最開始的時候老師讓我使用matlab,然后去學校的二手書店買了岡薩雷斯的數(shù)字圖像處理和數(shù)字圖像處理(matlab)版,簡單讀了一下,里面有很多公式和理論的東西。然后我用matlab簡單實現(xiàn)了一下里面的一些基本操作,比如說圖片的輸入輸出,邊緣檢測,二值化,腐蝕膨脹等一些傳統(tǒng)的處理手段,雖然現(xiàn)在深度學習用的不是很多,但是有時候一些情況還是需要使用的,而且對于處理圖像的我們來說,多多少少還是需要知道一些的,以后寫論文的時候也會用到去畫圖。

  在這之后我還研究了一段時間的追蹤,看了一些幀差法,光流法,背景差分法什么的,已經(jīng)記不住了,就剩個大概意思了,然后就去研究目標檢測了。

  后來10月份的時候我們報名了一個京東的豬臉識別大賽,可是發(fā)現(xiàn)什么都不會,感覺好心塞,慢慢的開始知道機器學習了,我在網(wǎng)上找了一些博客看了一些那種概述,大致知道了什么意思。隨后我在自己原來那臺沒有GPU的電腦上裝了ubuntu,這也是我第一次真正意義上用linux,之前在windows上裝過虛擬機的centos,我也沒怎么用。在我大概知道了這些以后,我發(fā)現(xiàn)我需要學習一門語言——python

  然后我就加了各種QQ群,問大家該如何學習,之后我選了一本python教材,名字我忘了就是什么零基礎入門什么的,后來我發(fā)現(xiàn)直接去菜鳥教程網(wǎng)站看就可以了,把基礎的看一下,如果你是計算機專業(yè)的或者之前編過程序,那應該很快就看完了,建議直接學python3,網(wǎng)站地址:Python 基礎教程 | 菜鳥教程。我之后又找了一個打飛機的游戲(別想多了)跟著教程編完了一個小項目,大致知道了這門語言的使用。

  對于linux的學習,如果之前沒用過ubuntu,建議去了解一下基本的系統(tǒng)操作和命令就好,比如cd,sudo,rm,clone,git什么的,因為之后的一些命令也是別人告訴你或者上網(wǎng)查,不用一下全記住,如果你要深入學的話,那就自己去找找教程吧。

  我還忘了說,python,Linux,還有之后的各種深度學習框架什么的,我有很多都去看了莫煩的視頻,那個我覺得入門真的挺有用的,即使現(xiàn)在看也有很多要學的,而且有很多系列,真的對于這種自己錄的要支持一下!不容易。地址:莫煩Python

  opencv也要學一下,有c++和python版的,原理基本一樣,只是實現(xiàn)的語言不同,很猛的開源視覺庫,可以買一本opencv3教程看一下,這個書網(wǎng)上比較統(tǒng)一,大部分都是這本。

  在學完這些,我就要開始了解深度學習和卷積神經(jīng)網(wǎng)絡了,這時,一位大神的視頻映入眼簾,他就是——吳恩達!這個的基本原理和過程我都是看的他的視頻,真的非常棒,我看了好幾遍,對神經(jīng)網(wǎng)絡的解讀比較透徹,反向傳播和梯度下降講的都比較細,廢話不多說了,網(wǎng)站:深度學習工程師微專業(yè) - 一線人工智能大師吳恩達親研-網(wǎng)易云課堂 - 網(wǎng)易云課堂,而且網(wǎng)易云課堂上還有很多其他的課,根據(jù)你喜歡的也可以去學一下。

  看完這個之后,我就去學習了pytorch和tensorflow了,但比較遺憾的說,到現(xiàn)在我也沒有好好掌握他倆,只是能簡單的編一些東西??赡芤彩俏覍W的比較雜,你可以選擇一個框架好好學學,對于這兩個框架,莫煩的還有他們的官方文檔都很詳細,你可以選擇去看。我當時是買的書,pytorch 的我買的博文的:深度學習入門之——pytorch,tensorflow的我買的機械工業(yè)出版社的深度學習之tensorflow入門,原理與進階實戰(zhàn)。這兩本都很適合入門。而且現(xiàn)在已經(jīng)出了很多什么卷積神經(jīng)網(wǎng)絡進階實戰(zhàn)啊,有很多,我看了目錄,都很不錯。可以自己挑一挑。caffe我沒有學,這三種caffe比較學術(shù),pytorch比較容易入門,tensorflow普及比較多,(松明同學指出我此處表述有誤,修改如下,謝謝提醒:keras是基于tf的一個高級神經(jīng)網(wǎng)絡API)可以自己選擇一下。

  關(guān)于深度學習環(huán)境的配置,可以參考我的另一篇文章,那里有詳細的配置,環(huán)境有點老,但是換湯不換藥,基本過程都那樣,現(xiàn)在比較忙我還沒有更新,配環(huán)境對于新手來說挺痛苦的,一定要堅持下去,我說我當時配了1個月你敢信?

  我目前研究的是目標檢測,很多方法在github上都有公開的代碼,可以下載運行慢慢研究,有的時候配完了不好用慢慢調(diào),要有耐心,最后一定會解決的,我已經(jīng)試了很多次了。而且QQ群有的時候還是挺有用的,虛心請教。

  暫時先寫這么多吧,如果你的學習道路上也有什么好的方法可以發(fā)一下,我們一起學習!還有我現(xiàn)在在實習,公司的同事們也很照顧我,給我講一些學術(shù)道路上的方法啊,工作上的計劃啊,幫助我修改論文,很開心遇到他們!所以,如果你是研一的小伙伴們,這一年抓緊時間學學,研二就可以出來實習一波了(前提你的論文怎么也得有個方向吧,并且老板要同意)!

  ————————————————————

  2019.07 不少同學留言反應岡薩雷斯那本書晦澀難懂,我也有點這樣感覺,我當時也沒讀多細,就是簡單看了看,如果感覺用處不大,直接看opencv的操作就行,那上面?zhèn)鹘y(tǒng)處理講的也挺細的。

  還有就是有同學問我學python或者c++怎么看,自我感覺菜鳥網(wǎng)站也是個不錯的地方,大家可以去看看


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。