Senarai 10 Buku Sains Data Terbaik dan Penerangan untuk Generalist

Senarai 10 Buku Sains Data Terbaik Dan Penerangan Untuk Generalist



Sains Data ialah bidang pengajian yang mengendalikan sejumlah besar data menggunakan kaedah, proses, algoritma dan sistem saintifik untuk mencari corak yang tidak kelihatan, memperoleh maklumat yang bermakna, membuat keputusan perniagaan dalam syarikat, dan juga digunakan dalam institusi bukan perniagaan. Institusi bukan perniagaan termasuk industri untuk Penjagaan Kesihatan, Permainan, Pengiktirafan Imej, Sistem Pengesyoran, Logistik, Pengesanan Penipuan (institusi perbankan dan kewangan), Carian Internet, Pengiktirafan pertuturan, Pengiklanan Sasaran, Perancangan Laluan Syarikat Penerbangan dan Realiti Diperkukuh. Sains Data ialah sub-set Kecerdasan Buatan. Data yang digunakan untuk analisis boleh datang dari pelbagai sumber yang berbeza dan dibentangkan dalam pelbagai format. Sesetengah data sumber mungkin diseragamkan; yang lain mungkin tidak diseragamkan.

Untuk meletakkannya dengan cara lain, metodologi yang berbeza digunakan untuk mengumpulkan data (plural datum). Kemudian, pengetahuan (kesimpulan berharga) diekstrak daripada data yang dihimpun. Dalam proses itu, selepas data terkumpul, penyelidikan dilakukan ke atasnya (data) untuk mendapatkan data (hasil) baru dari mana masalah diselesaikan.







Sains Data sebagai disiplin (utama) wujud di peringkat Ijazah Sarjana Muda dan Sarjana di universiti. Walau bagaimanapun, hanya beberapa universiti di dunia yang menawarkan Sains Data di Ijazah Sarjana Muda atau Sarjana. Di peringkat Ijazah Sarjana Muda, pelajar lulus dengan ijazah dalam Sains Data. Ini seperti ijazah tujuan umum. Di peringkat Ijazah Sarjana, pelajar meninggalkan Ijazah Pasca Siswazah dalam Sains Data, pengkhususan dalam Analitis Data, Kejuruteraan Data, atau sebagai Saintis Data.



Ia mungkin mengejutkan pembaca dan mungkin malangnya, Pembelajaran Mesin, Pemodelan, Statistik, Pengaturcaraan dan Pangkalan Data adalah pengetahuan prasyarat untuk mempelajari Sains Data di peringkat Ijazah Sarjana Muda walaupun pada hakikatnya mereka adalah kursus universiti yang dihormati dalam hak mereka sendiri, dipelajari di disiplin lain di peringkat Ijazah Sarjana Muda atau peringkat Sarjana. Walau bagaimanapun, apabila pelajar pergi ke universiti untuk belajar Sains Data di peringkat ijazah, semua kursus ini akan tetap dipelajari, bersama atau sebelum kursus yang sepatutnya, untuk Sains Data.



Sains Data untuk Ijazah Sarjana Muda atau pengkhususannya seperti Analitis Data, Kejuruteraan Data, atau sebagai Saintis Data masih dibangunkan; walaupun mereka sampai ke peringkat yang diaplikasikan dalam industri setelah belajar (di universiti). Sains Data adalah disiplin yang agak baru, secara keseluruhan.





Ingat bahawa anda harus terlebih dahulu menjadi pakar umum sebelum menjadi pakar. Perbezaan antara program pakar masih belum jelas. Perbezaan antara program generalis dan pakar masih belum jelas.

Memandangkan Sains Data adalah disiplin yang agak baru, buku yang ditetapkan dalam dokumen ini adalah berdasarkan liputan kandungan dan bukan pedagogi (seberapa baik buku itu mengajar). Dan mereka adalah untuk program Ijazah Sarjana Muda (generalis). Terdapat kursus generalis yang berbeza.



Senarai

Untuk butiran lanjut dan kemungkinan pembelian dengan kad kredit, hiperpautan untuk setiap buku diberikan. Tidak satu pun buku merangkumi semua kursus umum.

Matematik Penting untuk Sains Data: Kalkulus, Statistik, Teori Kebarangkalian dan Algebra Linear

Ditulis oleh: Hadrien Jean

  • Penerbit: Hadrien Jean
  • Tarikh Diterbitkan: Selepas 30 September 2020
  • Bahasa: Bahasa Inggeris
  • Bilangan Halaman: ‎lebih daripada 400

Kandungan buku ini boleh dilihat sebagai kursus matematik untuk Sains Data. Walaupun tidak disyorkan untuk belajar Sains Data sendiri, graduan sekolah menengah yang ingin belajar Sains Data sendiri harus bermula dengan buku ini.

Kandungan: Kalkulus; Statistik dan Kebarangkalian; Algebra Linear; Skalar dan Vektor; Matriks dan Tensor; Span, Kebergantungan Linear dan Transformasi Ruang; Sistem Persamaan Linear; Eigenvectors dan Eigenvalues; Penguraian Nilai Tunggal.

https://www.essentialmathfordatascience.com/

Panduan Akal Waras untuk Struktur Data dan Algoritma: Tingkatkan Kemahiran Pengaturcaraan Teras Anda / Edisi Ke-2

Ditulis oleh: Jay Wengrow

  • Penerbit: Rak Buku Pragmatik
  • Tarikh Diterbitkan: 15 September 2020
  • Bahasa: Bahasa Inggeris
  • Dimensi: 7.5 x 1.25 x 9.25 inci
  • Bilangan Muka Surat: ‎508

Buku ini membincangkan algoritma dan struktur data yang digunakan dalam Sains Data. Andaikan ada yang belajar Sains Data sendiri selepas tamat sekolah menengah, maka ini adalah buku seterusnya yang perlu dibaca selepas membaca buku matematik sebelum ini. Program contoh diberikan dalam JavaScript, Python, dan Ruby.

Kandungan: Mengapa Struktur Data Penting; Mengapa Algoritma Penting; O ya! Notasi O Besar; Mempercepatkan Kod Anda dengan Big O; Mengoptimumkan Kod dengan dan Tanpa Big O; Mengoptimumkan untuk Senario Optimis; O Besar dalam Kod Harian; Carian Pantas yang Membara dengan Jadual Hash; Membuat Kod Elegan dengan Tindanan dan Baris Gilir; Rekursif Berulang dengan Rekursi; Belajar Menulis dalam Rekursif; Pengaturcaraan Dinamik; Algoritma Rekursif untuk Kelajuan; Struktur Data Berasaskan Nod; Mempercepatkan Semua Perkara dengan Pokok Carian Binari; Menjaga Keutamaan Anda Lurus dengan Timbunan; Tidak Sakit Mencuba; Menghubungkan Semuanya dengan Graf; Menangani Kekangan Ruang; Teknik untuk Pengoptimuman Kod

Sains Data Lebih Pintar: Berjaya dengan Data Gred Perusahaan dan Projek AI / 1 st Mengedit

Ditulis oleh: Neal Fishman, Cole Stryker, dan Grady Booch

  • Penerbit: Wiley
  • Tarikh Diterbitkan: 14 April 2020
  • Bahasa: Bahasa Inggeris
  • Bilangan Muka Surat: ‎286

Kandungan: Mendaki Tangga AI; Pembingkaian Bahagian I: Pertimbangan untuk Organisasi Menggunakan AI; Pembingkaian Bahagian II: Pertimbangan untuk Bekerja dengan Data dan AI; Imbas Kembali pada Analitis: Lebih Daripada Satu Tukul; Pandangan ke Hadapan pada Analitis: Tidak Semuanya Boleh Menjadi Kuku; Menangani Disiplin Operasi pada Tangga AI; Memaksimumkan Penggunaan Data Anda: Didorong Nilai; Menghargai Data dengan Analisis Statistik dan Membolehkan Capaian Bermakna; Membina untuk Jangka Panjang; A Journey’s End: IA untuk AI.

Pembelajaran Mesin: Perspektif Kebarangkalian (Siri Pengiraan Suaian dan Pembelajaran Mesin) Edisi Bergambar

Ditulis oleh: Kevin P. Murphy

  • Penerbit: The MIT Press
  • Tarikh Diterbitkan: 24 Ogos 2012
  • Bahasa: Bahasa Inggeris
  • Dimensi: 8.25 x 1.79 x 9.27 inci
  • Bilangan Muka Surat: ‎1104

Buku ini bagus untuk pemula. Sekali lagi, seperti semua buku lain yang ditetapkan dalam dokumen ini, buku ini tidak merangkumi semua yang diperlukan untuk program generalis yang, malangnya, masih belum dimuktamadkan (program pakar juga masih belum dimuktamadkan). Pemula biasa di sini ialah lulusan sekolah menengah dengan kelulusan dalam matematik dan sains komputer.

Kandungan: Pengenalan (Pembelajaran mesin: apa dan mengapa?, Pembelajaran tanpa pengawasan, Beberapa konsep asas dalam pembelajaran mesin); Kebarangkalian; Model generatif untuk data diskret; model Gaussian; Statistik Bayesian; Statistik kerap; Regresi linear; Regresi logistik; Model linear umum dan keluarga eksponen; Model grafik terarah (jaring Bayes); Model campuran dan algoritma EM; Model linear terpendam; Model linear jarang; bijirin; proses Gaussian; Model fungsi asas penyesuaian; Markov dan model Markov tersembunyi; Negeri model angkasa; Model grafik tidak terarah (medan rawak Markov); Inferens tepat untuk model grafik; Inferens variasi; Lebih banyak inferens variasi; inferens Monte Carlo; Inferens rantaian Markov Monte Carlo (MCMC); Pengelompokan; Pembelajaran struktur model grafik; Model pembolehubah terpendam untuk data diskret; Pembelajaran yang mendalam.

Sains Data untuk Perniagaan: Perkara yang Anda Perlu Tahu Tentang Perlombongan Data dan Pemikiran Analitik Data / Edisi Pertama

Ditulis oleh: Tom Fawcett dan Foster Provost

  • Penerbit: O'Reilly Media
  • Tarikh Diterbitkan: 17 September 2013
  • Bahasa: Bahasa Inggeris
  • Dimensi: 7 x 0.9 x 9.19 inci
  • Bilangan Muka Surat: ‎413

Kandungan: Pemikiran Analitik Data; Masalah Perniagaan dan Penyelesaian Sains Data; Pengenalan kepada Pemodelan Ramalan: Daripada Korelasi kepada Segmentasi Terselia; Memasang Model pada Data; Overfitting dan Pengelakannya; Persamaan, Jiran dan Kelompok; Pemikiran Analitik Keputusan I: Apakah Model Yang Baik?; Mengvisualkan Prestasi Model; Bukti dan Kebarangkalian; Mewakili dan Melombong Teks; Pemikiran Analitikal Keputusan II: Ke Arah Kejuruteraan Analitikal; Tugas dan Teknik Sains Data Lain; Sains Data dan Strategi Perniagaan; Kesimpulan.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Statistik Praktikal untuk Saintis Data: 50+ Konsep Penting Menggunakan R dan Python / Edisi Ke-2

Ditulis oleh: Peter Bruce, Andrew Bruce, dan Peter Gedeck

  • Penerbit: O'Reilly Media
  • Tarikh Diterbitkan: 2 Jun 2020
  • Bahasa: Bahasa Inggeris
  • Dimensi: 7 x 0.9 x 9.1 inci
  • Bilangan Muka Surat: ‎368

Kandungan: Analisis Data Penerokaan, Taburan Data dan Persampelan, Eksperimen Statistik dan Ujian Kepentingan, Regresi dan Ramalan, Klasifikasi, Pembelajaran Mesin Statistik, Pembelajaran Tanpa Selia.

Buku Mengapa: Sains Baru Sebab dan Akibat

Ditulis oleh: Judea Pearl, Dana Mackenzie

  • Penerbit: Buku Asas
  • Tarikh Diterbitkan: 15 Mei 2018
  • Bahasa: Bahasa Inggeris
  • Dimensi: 6.3 x 1.4 x 9.4 inci
  • Bilangan Muka Surat: ‎432

Walaupun banyak buku Sains Data menggunakan industri perniagaan tulen untuk ilustrasi, buku ini menggunakan industri perubatan dan disiplin lain untuk ilustrasi.

Kandungan: Pengenalan: Mind over Data; Tangga Penyebab; Daripada Buccaneers kepada Babi Guinea: Kejadian Inferens Sebab; Daripada Bukti kepada Punca: Pendeta Bayes Bertemu Encik Holmes; Mengelirukan dan Mengelirukan: Atau, Membunuh Pembolehubah Bersembunyi; Perbahasan Penuh Asap: Membersihkan Udara; Paradoks Berlimpah-limpah!; Melangkaui Pelarasan: Penaklukan Campur Tangan Gunung; Counterfactuals: Dunia Perlombongan Yang Mungkin Ada; Pengantaraan: Pencarian Mekanisme; Data Besar, Kepintaran Buatan dan Soalan Besar.

Bina Kerjaya dalam Sains Data

Ditulis oleh: Emily Robinson dan Jacqueline Nolis

  • Penerbit: Manning
  • Tarikh Diterbitkan: 24 Mac 2020
  • Bahasa: Bahasa Inggeris
  • Dimensi: 7.38 x 0.8 x 9.25 inci
  • Bilangan Muka Surat: ‎354

Kandungan: Bermula dengan Sains Data; Mencari Kerja Sains Data anda; Menetap dalam Sains Data; Berkembang dalam peranan Sains Data anda.

https://www.manning.com/books/build-a-career-in-data-science

Sains Data untuk Dummies / Edisi Ke-2

Ditulis oleh: Lillian Pierson

  • Penerbit: For Dummies
  • Tarikh Diterbitkan: 6 Mac 2017
  • Bahasa Inggeris
  • Dimensi: 7.3 x 1 x 9 inci
  • Bilangan Muka Surat: ‎384

Buku ini menganggap bahawa pembaca sudah mempunyai pengetahuan matematik dan pengaturcaraan yang diperlukan.

Kandungan:  Meliputi Sains Data; Meneroka Saluran Paip dan Infrastruktur Kejuruteraan Data; Menggunakan Cerapan Terpacu Data pada Perniagaan dan Industri; Pembelajaran Mesin: Belajar daripada Data dengan Mesin Anda; Pemodelan Matematik, Kebarangkalian dan Statistik; Menggunakan Pengelompokan untuk Membahagikan Data; Pemodelan dengan Contoh; Membina Model Yang Mengendalikan Peranti Internet-of-Things; Mengikuti Prinsip Reka Bentuk Visualisasi Data; Menggunakan D3.js untuk Visualisasi Data; Aplikasi Berasaskan Web untuk Reka Bentuk Visualisasi; Meneroka Amalan Terbaik dalam Reka Bentuk Papan Pemuka; Membuat Peta daripada Data Spatial; Menggunakan Python untuk Sains Data; Menggunakan Sumber Terbuka R untuk Sains Data; Menggunakan SQL dalam Sains Data; Melakukan Sains Data dengan Excel dan Knime; Sains Data dalam Kewartawanan: Memakukan Lima Ws (dan H); Mempelajari Sains Data Alam Sekitar; Sains Data untuk Memacu Pertumbuhan dalam E-Dagang; Menggunakan Sains Data untuk Menghuraikan dan Meramalkan Aktiviti Jenayah; Sepuluh Sumber Fenomena untuk Data Terbuka; Sepuluh Alat dan Aplikasi Sains Data Percuma.

Perlombongan Set Data Besar-besaran / 3 rd Mengedit

Ditulis oleh: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Penerbit: Cambridge University Press
  • Tarikh Diterbitkan: 13 Februari 2020
  • Bahasa Inggeris
  • Dimensi: 7 x 1 x 9.75 inci
  • Bilangan Muka Surat: ‎565

Buku ini juga menganggap bahawa pembaca sudah mempunyai pengetahuan matematik dan pengaturcaraan yang diperlukan.

Kandungan: Perlombongan Data; MapReduce dan Timbunan Perisian Baharu; Algoritma Menggunakan MapReduce; Mencari Barangan Serupa; Aliran Data Perlombongan; Analisis Pautan; Itemset Kerap; Pengelompokan; Pengiklanan di Web; Sistem Pengesyoran; Graf Rangkaian Sosial Perlombongan; Pengurangan Dimensi; Pembelajaran Mesin Berskala Besar.

Kesimpulan

Perbezaan antara program pakar masih belum jelas. Perbezaan antara program generalis dan pakar juga masih belum jelas. Walau bagaimanapun, selepas membaca senarai buku yang diberikan, pembaca akan berada dalam kedudukan untuk lebih menghargai peranan khas penganalisis data, kejuruteraan data dan saintis data, dan kemudian bergerak ke hadapan.