Cara menggunakan lembar contekan sklearn pdf

Jika Anda kesulitan mengingat semua perintah yang berbeda untuk melakukan operasi yang berbeda di Scikit Learn, maka jangan khawatir, Anda tidak sendiri, ini terjadi lebih sering daripada yang Anda kira.

Unduh PDF yang dapat dicetak dari lembar contekan ini

Python Scikit-Learn Cheat Sheet

Di Intellipaat, kami memastikan bahwa pembelajar kami mendapatkan yang terbaik dari layanan e-learning kami dan itulah mengapa kami membuat Sklearn Cheat-Sheet ini untuk mendukung pembelajar kami, jika mereka membutuhkan referensi praktis untuk membantu mereka mendapatkan dimulai dengan Scikit dalam pelatihan python

Lembar contekan ini telah dirancang dengan asumsi bahwa Anda memiliki pengetahuan dasar tentang python dan pembelajaran mesin tetapi membutuhkan referensi cepat untuk beralih ketika Anda perlu mencari perintah di Scikit

Pelajari lebih lanjut tentang Lembar Curang Scikit-Pelajari

Apa itu Scikit Learn?

Scikit-Learn atau "sklearn" adalah pustaka pembelajaran mesin sumber terbuka gratis untuk bahasa pemrograman Python. Ini adalah alat sederhana namun efisien untuk penambangan data, analisis data, dan pembelajaran mesin. Ini menampilkan berbagai algoritme pembelajaran mesin dan juga mendukung perpustakaan ilmiah dan numerik Python, yaitu SciPy dan NumPy. Kembali belajar Python untuk semua topik lainnya

Certification in Full Stack Web Development

Konvensi Impor

Sebelum Anda dapat mulai menggunakan Python Scikit-learn, Anda harus ingat bahwa ini adalah pustaka Python dan Anda perlu mengimpornya. Untuk melakukan itu yang harus Anda lakukan adalah mengetikkan perintah berikut

import sklearn 

Preprocessing

Proses mengubah kumpulan data mentah menjadi kumpulan data yang bermakna dan bersih disebut sebagai Preprocessing data. Ini adalah teknik 'harus diikuti' sebelum Anda dapat memasukkan kumpulan data Anda ke algoritme pembelajaran mesin. Ada tiga langkah utama yang perlu Anda ikuti saat melakukan prapemrosesan data. Langkah-langkahnya tercantum di bawah ini

1. Memuat Data

Anda membutuhkan data Anda dalam bentuk numerik yang disimpan dalam array numerik. Berikut adalah dua cara Anda dapat memuat data, Anda juga dapat menggunakan beberapa larik numerik lainnya untuk memuat data Anda

Gunakan NumPy

import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
>>>import pandas as pd
>>>df=pd.read_csv(‘file_name.csv’,header=0)

2. Data Uji Kereta

Langkah selanjutnya adalah membagi data Anda menjadi kumpulan data pelatihan dan kumpulan data pengujian

>>>from sklearn.model_selection import train_test_split
>>>X_train, X_test, y_train, y_test = train_test_split(X,y, random_state=0)

3. Persiapan data

Standardisasi. Itu membuat proses pelatihan berperilaku baik meningkatkan kondisi numerik dari masalah optimisasi

>>>from sklearn.preprocessing import StandardScaler
>>>get_names = df.columns
>>>scaler = preprocessing.StandardScaler()
>>>scaled_df = scaler.fit_transform(df)
>>>scaled_df = pd.DataFrame(scaled_df, columns=get_names)
_

Normalisasi. Itu membuat pelatihan kurang sensitif terhadap skala fitur, juga membuat data dikondisikan lebih baik untuk konvergensi

>>>from sklearn.preprocessing import Normalizer
>>>pd.read_csv("File_name.csv")
>>>x_array = np.array(df[‘Column1’])#Normalize Column1
>>>normalized_X = preprocessing.normalize([x_array])

Become a Full Stack Web Developer

Bekerja pada model

Setelah melakukan semua transformasi yang diperlukan dalam kumpulan data kami, untuk membuatnya siap dengan algoritme, kami perlu mengerjakan model kami, yaitu, memilih model yang benar atau algoritme yang mewakili kumpulan data kami dan akan membantu kami membuat jenis prediksi yang kita inginkan dari kumpulan data pilihan kita dan kemudian melakukan pemasangan model

Pemilihan Model

  • Estimator Pembelajaran yang Diawasi

Pembelajaran yang diawasi, seperti namanya, adalah jenis pembelajaran mesin di mana kami mengawasi hasilnya dengan melatih model dengan data yang diberi label dengan baik, yang berarti bahwa beberapa data dalam kumpulan data sudah ditandai dengan jawaban yang benar

a. Regresi linier

>>> from sklearn.linear_model import LinearRegression
>>>new_lr = LinearRegression(normalize=True)
_

b. Mendukung Mesin Vektor

>>>from sklearn.svm import SVC
>>>new_svc = SVC(kernel='linear')

c. Naif Bayes

>>>from sklearn.naive_bayes import GaussianNB
>>>new_gnb = GaussianNB()
_

d. KNN

>>>from sklearn import neighbors
>>>knn=neighbors.KNeighborsClassifier(n_neighbors=1)
_
  • Estimator Pembelajaran Tanpa Pengawasan

Tidak seperti Pembelajaran yang diawasi, pembelajaran yang tidak diawasi adalah tempat kami melatih model dengan data yang tidak berlabel atau data yang tidak diklasifikasikan dan membiarkan algoritme melakukan semua pekerjaan pada kumpulan data itu tanpa bantuan apa pun
a. Analisis Komponen Utama (PCA)

import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
_0

b. K Berarti

import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
_1

Pemasangan Model

Tujuan penerapan model fitting adalah untuk mempelajari seberapa baik model akan digeneralisasikan ketika dilatih dengan dataset yang mirip dengan dataset yang awalnya dilatih oleh model tersebut. Model yang lebih pas akan menghasilkan hasil yang lebih akurat

import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
2
import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
3

Certification in Full Stack Web Development

Pengolahan pasca

Setelah merasa nyaman dengan dataset dan model kami, langkah selanjutnya adalah akhirnya mengikuti tujuan utama algoritme pembelajaran mesin, yaitu meramalkan hasil dan membuat prediksi

Ramalan

Setelah Anda selesai memilih dan menyesuaikan model, Anda dapat membuat prediksi pada dataset Anda
Diawasi

import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
_4
import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
5

Evaluasi Kinerja

Mengevaluasi kinerja prediktif model Anda diperlukan. Ada beberapa teknik dalam pembelajaran mesin yang dapat digunakan untuk mengatur pengklasifikasi dan memvisualisasikan kinerjanya. Berikut ini adalah teknologi tersebut

Klasifikasi

a. Matriks Kebingungan

import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
_6

b. Skor Akurasi

import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
_7

Regresi

a. Berarti Kesalahan Mutlak

import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
_8

b. Kesalahan Kuadrat Rata-Rata

import numpy as np
>>>a=np.array([(1,2,3,4),(7,8,9,10)],dtype=int)
>>>data = np.loadtxt('file_name.csv', delimiter=',')
_9

c. Skor R²

>>>import pandas as pd
>>>df=pd.read_csv(‘file_name.csv’,header=0)
0

Kekelompokan

a. Homogenitas

>>>import pandas as pd
>>>df=pd.read_csv(‘file_name.csv’,header=0)
1

b. Ukuran V

>>>import pandas as pd
>>>df=pd.read_csv(‘file_name.csv’,header=0)
2

c. Validasi silang

>>>import pandas as pd
>>>df=pd.read_csv(‘file_name.csv’,header=0)
_3

Penyetelan Model

Ini adalah langkah terakhir saat mengimplementasikan pembelajaran mesin, sebelum mempresentasikan hasil akhir. Dalam Penyetelan model, model diparameterisasi sehingga perilakunya disetel untuk masalah tertentu. Ini dilakukan dengan mencari set parameter yang tepat dan kami memiliki dua cara untuk melakukannya

Dalam pencarian Grid, penyetelan parameter dilakukan secara metodis dan kemudian mengevaluasi model untuk setiap set parameter yang ditentukan dalam grid

>>>import pandas as pd
>>>df=pd.read_csv(‘file_name.csv’,header=0)
_4
  • Optimasi Parameter Acak

Dalam Pencarian Acak, pencarian acak dilakukan pada sekumpulan parameter tetap. Jumlah parameter yang digunakan diberikan oleh n-iter

>>>import pandas as pd
>>>df=pd.read_csv(‘file_name.csv’,header=0)
5

Dengan ini, berakhirlah lembar contekan Sklearn ini. Anda dapat mendaftar untuk Pelatihan Sertifikasi Python yang disediakan oleh Intellipaat untuk pengetahuan yang mendetail dan mendalam. Program pelatihan ini akan memandu Anda langkah demi langkah akan memberi Anda semua keterampilan yang tepat untuk menguasai salah satu bahasa yang paling populer dan banyak digunakan, Python. Tidak hanya itu, Anda juga akan mendapatkan pengetahuan tentang semua pustaka dan modul penting dalam python seperti, seperti fungsi SciPy, NumPy, MatPlotLib, Scikit-learn, Pandas, Lambda, dan lainnya. Juga, Intellipaat akan membantu Anda dengan pertanyaan wawancara python gratis oleh para ahli. Anda akan mendapatkan dukungan teknis 24*7 dan bantuan dari para ahli di masing-masing teknologi di Intellipaat selama periode sertifikasi