Machine Learning Dengan Python - Dasar-dasar Machine Learning

Dasar-dasar  Machine Learing
Kita hidup di 'era data' yang diperkaya dengan kekuatan komputasi yang lebih baik dan sumber daya penyimpanan yang lebih banyak. Data atau informasi ini meningkat dari hari ke hari, tetapi tantangan sebenarnya adalah memahami semua data. Bisnis & organisasi berusaha untuk menghadapinya dengan membangun sistem cerdas menggunakan konsep dan metodologi dari ilmu data (data science), penambangan data (data mining), dan pembelajaran mesin (machine learning). Di antara mereka, machine learning adalah bidang ilmu komputer yang paling menarik. Tidak salah jika kita menyebut aplikasi machine learning dan ilmu algoritma yang memberikan arti pada data.

Apa itu Machine Learning?

Machine Learning (ML) adalah bidang ilmu komputer dengan bantuan sistem komputer yang dapat memberikan pengertian pada data dengan cara yang sama seperti manusia. Dengan kata sederhana, ML adalah jenis artificial intelligence yang mengekstrak pola dari data mentah dengan menggunakan algoritma atau metode. Fokus utama ML adalah untuk memungkinkan sistem komputer belajar dari pengalaman tanpa diprogram secara eksplisit atau intervensi manusia.

Kebutuhan akan Machine Learning

Manusia, pada saat ini, adalah spesies paling cerdas dan paling maju di dunia karena mereka dapat berpikir, mengevaluasi, dan memecahkan masalah yang kompleks. Di sisi lain, AI masih dalam tahap awal dan belum melampaui kecerdasan manusia dalam banyak aspek. Lalu pertanyaannya adalah apa perlunya membuat mesin belajar? Alasan paling tepat untuk melakukan ini adalah, "untuk membuat keputusan, berdasarkan data, dengan efisiensi dan skala".

Akhir-akhir ini, organisasi banyak berinvestasi dalam teknologi yang lebih baru seperti artificial intelligence, machine learnig dan deep learning untuk mendapatkan kunci informasi dari data untuk melakukan beberapa tugas dunia nyata dan menyelesaikan masalah. Kita dapat menyebutnya keputusan berdasarkan data yang diambil oleh mesin, terutama untuk mengotomatiskan proses. Keputusan yang digerakkan oleh data ini dapat digunakan, alih-alih menggunakan logika pemrograman, dalam masalah yang tidak dapat diprogram secara inheren. Faktanya adalah bahwa kita tidak dapat melakukannya tanpa kecerdasan manusia, tetapi aspek lainnya adalah bahwa kita semua harus menyelesaikan masalah dunia nyata dengan efisiensi dalam skala besar. Itulah mengapa kebutuhan akan machine learning muncul.

Mengapa & Kapan Membuat Mesin Belajar?

Kita telah membahas perlunya pembelajaran mesin, tetapi pertanyaan lain muncul bahwa dalam skenario apa kita harus membuat mesin belajar? Mungkin ada beberapa keadaan di mana kita membutuhkan mesin untuk mengambil keputusan berbasis data dengan efisiensi dan dalam skala besar. Berikut ini adalah beberapa keadaan di mana membuat mesin belajar akan lebih efektif.
Kurangnya keahlian manusia

Skenario pertama di mana kita menginginkan mesin untuk belajar dan mengambil keputusan berdasarkan data, bisa menjadi domain di mana kurangnya keahlian manusia. Contohnya dapat berupa navigasi di wilayah yang tidak diketahui atau planet spasial.
Skenario dinamis

Ada beberapa skenario yang bersifat dinamis yaitu mereka terus berubah dari waktu ke waktu. Dalam kasus skenario dan perilaku ini, kita ingin mesin untuk belajar dan mengambil keputusan berdasarkan data. Beberapa contoh dapat berupa konektivitas jaringan dan ketersediaan infrastruktur dalam suatu organisasi.
Kesulitan dalam menerjemahkan keahlian ke dalam tugas komputasi

Mungkin ada berbagai domain di mana manusia memiliki keahlian mereka; Namun, mereka tidak dapat menerjemahkan keahlian ini menjadi tugas komputasi. Dalam keadaan seperti itu kita menginginkan machine learning. Contoh-contohnya bisa berupa domain speech recognition, cognitive tasks dll.

Model Machine Learning

Sebelum membahas model machine learning, kita harus memahami definisi formal ML berikut yang diberikan oleh profesor Mitchell -
"Suatu program komputer dikatakan belajar dari pengalaman E sehubungan dengan beberapa kelas tugas T dan kinerja ukuran P, jika kinerjanya pada tugas-tugas di T, yang diukur dengan P, meningkat dengan pengalaman E."

Definisi di atas pada dasarnya berfokus pada tiga parameter, juga komponen utama dari setiap algoritma pembelajaran, yaitu Task (T), Performance (P) dan Experience (E). Dalam konteks ini, kita dapat menyederhanakan definisi ini sebagai -
ML adalah bidang AI yang terdiri dari algoritma pembelajaran yang -
  • Tingkatkan kinerja mereka (P)
  • Saat menjalankan beberapa tugas (T)
  • Seiring waktu dengan pengalaman (E)
Berdasarkan hal di atas, diagram berikut mewakili Model Pembelajaran Mesin -

Mari kita bahas lebih detail sekarang 

Task (T)

Dari perspektif masalah, kita dapat mendefinisikan tugas T sebagai masalah dunia nyata yang harus diselesaikan. Masalahnya bisa apa saja seperti menemukan harga rumah terbaik di lokasi tertentu atau untuk menemukan strategi pemasaran terbaik dll. Di sisi lain, jika kita berbicara tentang machine learing, definisi tugas (task) berbeda karena sulit untuk menyelesaikan tugas berbasis ML dengan pendekatan pemrograman konvensional.

Tugas T dikatakan sebagai tugas berbasis ML ketika didasarkan pada proses dan sistem harus ikut serta untuk beroperasi pada titik data. Contoh tugas berbasis ML adalah Classification, Regression, Structured annotation, Clustering, Transcription dll.

Experience (E)

Seperti namanya, ini adalah pengetahuan yang diperoleh dari titik data yang disediakan untuk algoritma atau model. Setelah diberikan dengan dataset, model akan berjalan secara iteratif dan akan mempelajari beberapa pola yang melekat. Pembelajaran yang diperoleh kemudian disebut Experience (E). Membuat analogi dengan pembelajaran manusia, kita dapat memikirkan situasi ini di mana manusia belajar atau mendapatkan pengalaman dari berbagai atribut seperti situasi, hubungan, dll. Supervised, unsupervised and reinforcement learning adalah beberapa cara untuk belajar atau mendapatkan pengalaman. Pengalaman yang diperoleh dari model ML atau algoritma akan digunakan untuk menyelesaikan tugas T.

Performance (p)

Algoritma ML seharusnya melakukan tugas dan mendapatkan pengalaman dengan berlalunya waktu. Ukuran yang memberitahu apakah algoritma ML berkinerja sesuai harapan atau tidak adalah kinerjanya (P). P pada dasarnya adalah metrik kuantitatif yang menceritakan bagaimana model melakukan tugas, T, menggunakan pengalamannya, E. Ada banyak metrik yang membantu untuk memahami kinerja ML, seperti accuracy score, F1 score, confusion matrix, precision, recall, sensitivity dll.

Tantangan dalam Machine Learning

Sementara Machine Learning berkembang pesat, membuat langkah signifikan dengan keamanan siber dan mobil otonom, segmen AI ini secara keseluruhan masih memiliki jalan panjang. Alasan di baliknya adalah bahwa ML belum mampu mengatasi sejumlah tantangan. Tantangan yang dihadapi ML saat ini adalah -

Kualitas data - Memiliki data berkualitas baik untuk algoritma ML adalah salah satu tantangan terbesar. Penggunaan data berkualitas rendah mengarah ke masalah yang terkait dengan preprocessing data dan ekstraksi fitur.

Time-Consuming task - Tantangan lain yang dihadapi oleh model ML adalah konsumsi waktu terutama untuk data acquisition, feature extraction and retrieval.

Kurangnya tenaga spesialis - Karena teknologi ML masih dalam tahap awal, ketersediaan sumber daya ahli adalah pekerjaan yang sulit.

Tidak ada tujuan yang jelas untuk merumuskan masalah bisnis - Tidak memiliki tujuan yang jelas dan tujuan yang jelas untuk masalah bisnis adalah tantangan utama bagi ML karena teknologi ini belum matang.

Masalah overfitting & underfitting - Jika model overfitting atau underfitting, model tidak dapat direpresentasikan dengan baik untuk masalah tersebut.

Curse of dimensionality - Tantangan lain yang dihadapi model ML adalah terlalu banyak fitur titik data. Ini bisa menjadi hambatan nyata.

Kesulitan dalam penyebaran - Kompleksitas model ML membuatnya cukup sulit untuk digunakan dalam kehidupan nyata.

Aplikasi Pembelajaran Mesin

Machine Learning adalah teknologi yang paling cepat berkembang dan menurut para peneliti, kita berada di tahun emas AI dan ML. ML digunakan untuk memecahkan banyak masalah kompleks dunia nyata yang tidak dapat diselesaikan dengan pendekatan tradisional. Berikut ini adalah beberapa aplikasi dunia nyata dari ML -
  • Emotion analysis
  • Sentiment analysis
  • Error detection and prevention
  • Weather forecasting and prediction
  • Stock market analysis and forecasting
  • Speech synthesis
  • Speech recognition
  • Customer segmentation
  • Object recognition
  • Fraud detection
  • Fraud prevention
  • Recommendation of products to customer in online shopping

Comments