Scikit-learn adalah pustaka pembelajaran mesin perangkat lunak gratis untuk bahasa pemrograman Python. Ini fitur berbagai klasifikasi, regresi, algoritma pengelompokan, dan alat yang efisien untuk penambangan data dan analisis data. Itu dibangun di atas NumPy, SciPy, dan Matplotlib Show Contoh Dasar Kode di bawah ini menunjukkan langkah-langkah dasar menggunakan scikit-learn untuk membuat dan menjalankan model pada sekumpulan data Langkah-langkah dalam kode termasuk. memuat data, membagi menjadi set pelatihan dan pengujian, menskalakan set, membuat model, menyesuaikan model pada data, menggunakan model terlatih untuk membuat prediksi pada set pengujian, dan terakhir mengevaluasi kinerja model >>> from sklearn import neighbors, datasets, preprocessing Memuat Data Data Anda harus numerik dan disimpan sebagai array NumPy atau matriks jarang SciPy. Tipe lain yang mengonversi ke array numerik, seperti Pandas DataFrame juga dapat diterima >>> import numpy as np_ Data Pelatihan dan Uji Membagi set data menjadi set pelatihan dan pengujian untuk variabel X dan y >>> from sklearn.model_selection import train_test_split Pra-pemrosesan Data Menyiapkan data sebelum model dipasang StandardisasiStandarisasikan fitur-fiturnya dengan menghapus rata-rata dan penskalaan ke varian satuan >>> from sklearn.preprocessing import StandardScaler NormalisasiSetiap sampel (mis. e. setiap baris matriks data) dengan setidaknya satu komponen bukan nol diskalakan ulang secara independen dari sampel lain sehingga normanya sama dengan satu >>> from sklearn.preprocessing import Normalizer _BinarisasiBinarisasi data (atur nilai fitur ke 0 atau 1) sesuai ambang batas >>> from sklearn.preprocessing import Binarizer Mengkodekan Fitur KategorikalEnkode label target dengan nilai antara 0 dan n_classes-1 >>> from sklearn import preprocessing _Memasukkan Nilai yang HilangTrafo imputasi untuk melengkapi nilai yang hilang >>> from sklearn.impute import SimpleImputer Menghasilkan Fitur PolinomialHasilkan matriks fitur baru yang terdiri dari semua kombinasi polinomial fitur dengan derajat kurang dari atau sama dengan derajat yang ditentukan >>> from sklearn.preprocessing import PolynomialFeatures _Buat Model Anda Penciptaan berbagai model pembelajaran terawasi dan tidak terawasi
>>> from sklearn.linear_model import LinearRegression _
>>> import numpy as np_0
>>> import numpy as np_1
>>> import numpy as np_2Model Pembelajaran Tanpa Pengawasan
>>> import numpy as np_3
>>> import numpy as np_4 Pemasangan Model Menyesuaikan model pembelajaran yang diawasi dan tidak diawasi ke dalam data Pembelajaran yang diawasi
>>> import numpy as np_5 Pembelajaran tanpa pengawasan
>>> import numpy as np_6
>>> import numpy as np_7 Ramalan Memprediksi set tes menggunakan model terlatih
>>> import numpy as np_8
>>> import numpy as np_9 Evaluasi Performa Model Anda Berbagai metrik regresi dan klasifikasi yang menentukan seberapa baik performa model pada set pengujian Metrik Klasifikasi
>>> from sklearn.model_selection import train_test_split 0
>>> from sklearn.model_selection import train_test_split 1
>>> from sklearn.model_selection import train_test_split 2Metrik Regresi
>>> from sklearn.model_selection import train_test_split _3
>>> from sklearn.model_selection import train_test_split _4
>>> from sklearn.model_selection import train_test_split 5Metrik Pengelompokan
>>> from sklearn.model_selection import train_test_split 6
>>> from sklearn.model_selection import train_test_split 7
>>> from sklearn.model_selection import train_test_split 8Validasi Silang
>>> from sklearn.model_selection import train_test_split _9Sesuaikan Model Anda Menemukan nilai parameter yang benar yang akan memaksimalkan akurasi prediksi model Pencarian KisiPencarian menyeluruh atas nilai parameter yang ditentukan untuk estimator. Contoh di bawah mencoba menemukan jumlah cluster yang tepat untuk menentukan knn guna memaksimalkan akurasi model >>> from sklearn.preprocessing import StandardScaler 0Pengoptimalan Parameter AcakPencarian acak pada hyperparameter. Berbeda dengan Pencarian Kisi, tidak semua nilai parameter dicoba, melainkan sejumlah pengaturan parameter diambil sampelnya dari distribusi yang ditentukan. Jumlah pengaturan parameter yang dicoba diberikan oleh n_iter >>> from sklearn.preprocessing import StandardScaler 1Scikit-learn adalah perpustakaan yang sangat berguna untuk berbagai model pembelajaran mesin. Bagian di atas memberikan proses langkah demi langkah dasar untuk melakukan analisis pada model yang berbeda. Namun jika Anda ingin mempelajari lebih lanjut, lihat dokumentasi untuk Scikit-Learn, karena masih banyak fungsi berguna yang dapat Anda pelajari Bergabunglah dengan daftar email saya dengan 5k+ orang untuk mendapatkan "Buklet Lembar Curang Python Lengkap untuk Ilmu Data" secara GRATIS |