5 Buku Percuma tentang Penglihatan Komputer
Penglihatan komputer ialah cabang Kecerdasan Buatan (AI) yang mengkaji cara mesin boleh mentafsir dan memahami maklumat visual, seperti imej dan video. Kebanyakan model penglihatan komputer hari ini adalah berdasarkan seni bina pembelajaran mendalam seperti Convolutional Neural Networks (CNN), yang cemerlang dalam tugas seperti pengelasan imej, pengesanan objek dan pembahagian. Walau bagaimanapun, asas-asas yang diperlukan untuk memahami secara mendalam bidang itu bermula pada zaman dahulu.
Untuk membantu anda menguasai bidang AI yang digunakan secara meluas ini, siaran ini menyenaraikan lima buku yang boleh anda baca secara percuma: teks klasik untuk memperoleh asas teori dan mempelajari teknik konvensional, dan yang lebih terkini meliputi model lanjutan seperti rangkaian saraf dalam.
1. Penglihatan Komputer: Algoritma dan Aplikasi (R. Szeliski)
Buku visi komputer yang diterbitkan oleh Springer ini boleh dibeli di kedai dalam talian utama. Namun begitu, ia boleh dimuat turun dari laman web pengarang tanpa sebarang kos untuk kegunaan peribadi sahaja. Menjangkau lebih 1200 halaman, ini merupakan sumber utama dalam bidang penglihatan komputer, meliputi pelbagai topik dan aplikasi: pengecaman objek, pemprosesan imej, pembinaan semula 3D, analisis gerakan dan banyak lagi.
2. Penglihatan Komputer: Model, Pembelajaran dan Inferens (S.J.D. Prince)
Teks rujukan klasik tersedia untuk dimuat turun di sini, ia menyediakan pengenalan komprehensif kepada penglihatan komputer, menggariskan konsep teras model dan teknik pembelajaran mesin yang digunakan dalam kebanyakan sistem penglihatan komputer. Ia juga merangkumi pengenalan yang mendalam kepada model kebarangkalian dan graf, kunci kepada banyak pendekatan penglihatan komputer.
3. Visi Komputer: Asas dan Aplikasi (nota kursus Stanford)
Kompilasi hebat yang dibuat oleh Rankay Krishna ini menghimpunkan nota kuliah daripada kursus senama Universiti Stanford. Pembacaan yang lebih ringkas tetapi menyeluruh tertumpu pada konsep dan takrifan yang jelas dalam bidang tersebut. Versi pdf boleh diakses di jabatan penglihatan Stanford di sini.
4. Pengaturcaraan Penglihatan Komputer dengan Python (J.E. Solem)
Buku di bawah Lesen Creative Commons ini mengalihkan tumpuan kepada pelaksanaan praktikal sistem penglihatan komputer dalam Python, menggunakan pendekatan dan perpustakaan tradisional. Dari halaman 1, ia menyelami contoh berasaskan Python untuk pemprosesan imej, diikuti dengan pelbagai aplikasi seperti realiti tambahan, pengelompokan imej dan klasifikasi imej. Buku ini merangkumi teknik penglihatan komputer tradisional tanpa rangkaian saraf dan seni bina pembelajaran mendalam yang terlibat, sebaliknya memfokuskan pada matematik, geometri dan pendekatan pembelajaran mesin klasik.
5. Pembelajaran Mendalam, MIT Press (I. Godfellow et al.)
Buku Deep Learning yang terkenal diterbitkan oleh MIT Press tidak boleh dimuat turun untuk diedarkan dalam format PDF, tetapi babnya tersedia secara umum untuk dibaca dalam format HTML di tapak web buku itu. Walaupun tidak hanya tertumpu pada penglihatan komputer, buku ini menyediakan bab penting untuk memahami sistem penglihatan moden berdasarkan seni bina CNN (bab 9), aplikasi penglihatan komputer (bab 12), dan pemodelan kebarangkalian data tidak berstruktur seperti imej (bab 16), untuk menamakan beberapa. Bab-bab ini adalah susulan yang ideal untuk pembaca lanjutan, selepas memperoleh asas visi komputer melalui buku yang disenaraikan sebelum ini.