Jika Anda kesulitan mengingat semua perintah yang berbeda untuk melakukan operasi yang berbeda di Scikit Learn, maka jangan khawatir, Anda tidak sendiri, ini terjadi lebih sering daripada yang Anda kira. Show Unduh PDF yang dapat dicetak dari lembar contekan ini Di Intellipaat, kami memastikan bahwa pembelajar kami mendapatkan yang terbaik dari layanan e-learning kami dan itulah mengapa kami membuat Sklearn Cheat-Sheet ini untuk mendukung pembelajar kami, jika mereka membutuhkan referensi praktis untuk membantu mereka mendapatkan dimulai dengan Scikit dalam pelatihan python Lembar contekan ini telah dirancang dengan asumsi bahwa Anda memiliki pengetahuan dasar tentang python dan pembelajaran mesin tetapi membutuhkan referensi cepat untuk beralih ketika Anda perlu mencari perintah di Scikit Pelajari lebih lanjut tentang Lembar Curang Scikit-Pelajari Apa itu Scikit Learn?Scikit-Learn atau "sklearn" adalah pustaka pembelajaran mesin sumber terbuka gratis untuk bahasa pemrograman Python. Ini adalah alat sederhana namun efisien untuk penambangan data, analisis data, dan pembelajaran mesin. Ini menampilkan berbagai algoritme pembelajaran mesin dan juga mendukung perpustakaan ilmiah dan numerik Python, yaitu SciPy dan NumPy. Kembali belajar Python untuk semua topik lainnya Konvensi ImporSebelum Anda dapat mulai menggunakan Python Scikit-learn, Anda harus ingat bahwa ini adalah pustaka Python dan Anda perlu mengimpornya. Untuk melakukan itu yang harus Anda lakukan adalah mengetikkan perintah berikut import sklearn PreprocessingProses mengubah kumpulan data mentah menjadi kumpulan data yang bermakna dan bersih disebut sebagai Preprocessing data. Ini adalah teknik 'harus diikuti' sebelum Anda dapat memasukkan kumpulan data Anda ke algoritme pembelajaran mesin. Ada tiga langkah utama yang perlu Anda ikuti saat melakukan prapemrosesan data. Langkah-langkahnya tercantum di bawah ini 1. Memuat DataAnda membutuhkan data Anda dalam bentuk numerik yang disimpan dalam array numerik. Berikut adalah dua cara Anda dapat memuat data, Anda juga dapat menggunakan beberapa larik numerik lainnya untuk memuat data Anda Gunakan NumPy import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',') >>>import pandas as pd >>>df=pd.read_csv(‘file_name.csv’,header=0) 2. Data Uji KeretaLangkah selanjutnya adalah membagi data Anda menjadi kumpulan data pelatihan dan kumpulan data pengujian >>>from sklearn.model_selection import train_test_split >>>X_train, X_test, y_train, y_test = train_test_split(X,y, random_state=0) 3. Persiapan dataStandardisasi. Itu membuat proses pelatihan berperilaku baik meningkatkan kondisi numerik dari masalah optimisasi >>>from sklearn.preprocessing import StandardScaler >>>get_names = df.columns >>>scaler = preprocessing.StandardScaler() >>>scaled_df = scaler.fit_transform(df) >>>scaled_df = pd.DataFrame(scaled_df, columns=get_names)_ Normalisasi. Itu membuat pelatihan kurang sensitif terhadap skala fitur, juga membuat data dikondisikan lebih baik untuk konvergensi >>>from sklearn.preprocessing import Normalizer >>>pd.read_csv("File_name.csv") >>>x_array = np.array(df[‘Column1’])#Normalize Column1 >>>normalized_X = preprocessing.normalize([x_array]) Bekerja pada modelSetelah melakukan semua transformasi yang diperlukan dalam kumpulan data kami, untuk membuatnya siap dengan algoritme, kami perlu mengerjakan model kami, yaitu, memilih model yang benar atau algoritme yang mewakili kumpulan data kami dan akan membantu kami membuat jenis prediksi yang kita inginkan dari kumpulan data pilihan kita dan kemudian melakukan pemasangan model Pemilihan Model
Pembelajaran yang diawasi, seperti namanya, adalah jenis pembelajaran mesin di mana kami mengawasi hasilnya dengan melatih model dengan data yang diberi label dengan baik, yang berarti bahwa beberapa data dalam kumpulan data sudah ditandai dengan jawaban yang benar a. Regresi linier >>> from sklearn.linear_model import LinearRegression >>>new_lr = LinearRegression(normalize=True)_ b. Mendukung Mesin Vektor >>>from sklearn.svm import SVC >>>new_svc = SVC(kernel='linear') c. Naif Bayes >>>from sklearn.naive_bayes import GaussianNB >>>new_gnb = GaussianNB()_ d. KNN >>>from sklearn import neighbors >>>knn=neighbors.KNeighborsClassifier(n_neighbors=1)_
Tidak seperti Pembelajaran yang diawasi, pembelajaran yang tidak diawasi adalah tempat kami melatih model dengan data yang tidak berlabel atau data yang tidak diklasifikasikan dan membiarkan algoritme melakukan semua pekerjaan pada kumpulan data itu tanpa bantuan apa pun import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')_0 b. K Berarti import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')_1 Pemasangan ModelTujuan penerapan model fitting adalah untuk mempelajari seberapa baik model akan digeneralisasikan ketika dilatih dengan dataset yang mirip dengan dataset yang awalnya dilatih oleh model tersebut. Model yang lebih pas akan menghasilkan hasil yang lebih akurat import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')2 import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')3 Pengolahan pascaSetelah merasa nyaman dengan dataset dan model kami, langkah selanjutnya adalah akhirnya mengikuti tujuan utama algoritme pembelajaran mesin, yaitu meramalkan hasil dan membuat prediksi RamalanSetelah Anda selesai memilih dan menyesuaikan model, Anda dapat membuat prediksi pada dataset Anda import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')_4 import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')5 Evaluasi KinerjaMengevaluasi kinerja prediktif model Anda diperlukan. Ada beberapa teknik dalam pembelajaran mesin yang dapat digunakan untuk mengatur pengklasifikasi dan memvisualisasikan kinerjanya. Berikut ini adalah teknologi tersebut Klasifikasia. Matriks Kebingungan import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')_6 b. Skor Akurasi import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')_7 Regresia. Berarti Kesalahan Mutlak import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')_8 b. Kesalahan Kuadrat Rata-Rata import numpy as np >>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int) >>>data = np.loadtxt('file_name.csv', delimiter=',')_9 c. Skor R² >>>import pandas as pd >>>df=pd.read_csv(‘file_name.csv’,header=0)0 Kekelompokana. Homogenitas >>>import pandas as pd >>>df=pd.read_csv(‘file_name.csv’,header=0)1 b. Ukuran V >>>import pandas as pd >>>df=pd.read_csv(‘file_name.csv’,header=0)2 c. Validasi silang >>>import pandas as pd >>>df=pd.read_csv(‘file_name.csv’,header=0)_3 Penyetelan ModelIni adalah langkah terakhir saat mengimplementasikan pembelajaran mesin, sebelum mempresentasikan hasil akhir. Dalam Penyetelan model, model diparameterisasi sehingga perilakunya disetel untuk masalah tertentu. Ini dilakukan dengan mencari set parameter yang tepat dan kami memiliki dua cara untuk melakukannya Dalam pencarian Grid, penyetelan parameter dilakukan secara metodis dan kemudian mengevaluasi model untuk setiap set parameter yang ditentukan dalam grid >>>import pandas as pd >>>df=pd.read_csv(‘file_name.csv’,header=0)_4
Dalam Pencarian Acak, pencarian acak dilakukan pada sekumpulan parameter tetap. Jumlah parameter yang digunakan diberikan oleh n-iter >>>import pandas as pd >>>df=pd.read_csv(‘file_name.csv’,header=0)5 Dengan ini, berakhirlah lembar contekan Sklearn ini. Anda dapat mendaftar untuk Pelatihan Sertifikasi Python yang disediakan oleh Intellipaat untuk pengetahuan yang mendetail dan mendalam. Program pelatihan ini akan memandu Anda langkah demi langkah akan memberi Anda semua keterampilan yang tepat untuk menguasai salah satu bahasa yang paling populer dan banyak digunakan, Python. Tidak hanya itu, Anda juga akan mendapatkan pengetahuan tentang semua pustaka dan modul penting dalam python seperti, seperti fungsi SciPy, NumPy, MatPlotLib, Scikit-learn, Pandas, Lambda, dan lainnya. Juga, Intellipaat akan membantu Anda dengan pertanyaan wawancara python gratis oleh para ahli. Anda akan mendapatkan dukungan teknis 24*7 dan bantuan dari para ahli di masing-masing teknologi di Intellipaat selama periode sertifikasi |