
Apa itu AutoML? Janji vs Realitas.by canva
Minggu lalu, DataRobot AutoML mengumpulkan $54 juta, membuat gelombang dalam komunitas pembelajaran mesin. AutoML, lalu, apa itu? Inilah janji versus fakta. Minggu lalu, DataRobot mengumpulkan $54 juta dalam putaran Seri C, sehingga total pendanaan mereka menjadi $111 juta, yang menyebabkan kehebohan di komunitas pembelajaran mesin. Perusahaan perangkat lunak DataRobot berbasis di Boston dan bekerja untuk mengotomatisasi solusi pembelajaran mesin (AutoML). Kurangnya ilmuwan data dan spesialis pembelajaran mesin yang berkualitas menghambat pengembangan teknologi ini dan adopsi yang meluas, terlepas dari hype yang mengelilinginya. CEO dan salah satu pendiri DataRobot, Jeremy Achin, ingin mengisi kekosongan tersebut dengan mengotomatiskan sebagian dari alur kerja ilmu data.
Optimisme dan skeptisisme yang berlebihan diekspresikan dalam menanggapi berita ini. Ada prediksi internet bahwa pembelajaran mesin akan segera didemokratisasi. Namun, Stacey Higginbotham, seorang pakar IoT, menyatakan ketidakpercayaannya : Perusahaan ini membuat klaim yang signifikan, yaitu dapat mengotomatiskan pengembangan AI. Karena pemikir teratas di Google, Facebook, Microsoft, dan Baidu bekerja keras menerbitkan makalah tentang upaya mereka yang belum selesai di sini, saya tidak terlalu percaya ini.” Meskipun saya dapat memahami motivasi di balik harapan dan kekhawatiran ini, Data Robot dan pembelajaran mesin otomatis pada umumnya tidak menjamin atau menegaskan semua ini. Kami dengan hati-hati mendefinisikan apa itu AutoML dan bukan untuk menghilangkan kebingungan ini dan memeriksa statusnya saat ini.
Apa itu AutoML?
Penting untuk membedakan antara ilmu data dan pembelajaran mesin sebelum menentukan AutoML. Perbedaannya bukan hanya salah satu semantik, seperti yang ditekankan oleh Matthew Mayo dari KDnuggets. Pemodelan data, seperti memilih algoritme terbaik dan menyempurnakan parameternya, adalah fokus utama pembelajaran mesin. sangat penting untuk kumpulan alat ilmu informasi yang lebih besar yang mencakup hal-hal seperti kesiapan informasi dan pemeriksaan yang mencerahkan, untuk memberikan beberapa contoh.
Mayo mendefinisikan AutoML sebagai “proses otomatis pemilihan algoritme, penyetelan hyperparameter, pemodelan iteratif, dan penilaian model” berdasarkan fakta ini. Ini bukan pengembangan kecerdasan buatan otomatis atau ilmu data otomatis. Namun, DataRobot mengklaim bahwa ia sedang “mengubah pembuatan model”, sebagaimana dinyatakan di situs webnya.

Image Credit: DataRobot
Oke, Jadi Apa Kegunaan AutoML?
Saat ini, memilih algoritme “terbaik” untuk setiap dataset membutuhkan keahlian atau intuisi data. Untuk mencapai akurasi tertinggi, data scientist menggunakan keahliannya untuk bereksperimen dengan berbagai model dan nilai hyperparameter. AutoML akan menguji algoritme secara berulang, mengevaluasi performanya, serta memilih dan menyempurnakan model lain, sehingga mengurangi ketergantungan kita pada intuisi. Dengan kata lain, ini akan mengotomatiskan proses pembelajaran mesin alur kerja sains data, seperti yang telah kami definisikan dengan cermat di atas.
Di bidang ini, DataRobot bukan satu-satunya perusahaan yang membuat kemajuan. Auto-sklearn untuk pengguna Python dan AutoWEKA untuk pengguna Weka adalah dua alat sumber terbuka tambahan. Model terbaik dikembalikan oleh TPOT, alat berbasis Python yang terintegrasi dengan pipa scikit-learn standar.
Masa Depan AutoML
Pengembang utama proyek TPOT, Randy Olson, menyatakan optimismenya bahwa AutoML akan menjadi hal biasa dan membantu dalam pembangunan model. Dia buru-buru memaafkan kekhawatiran tentang AutoML yang menggantikan peneliti informasi, karena dia berfokus pada bahwa “alasan AutoML adalah untuk membebaskan peneliti informasi dari beban usaha yang membosankan dan membosankan (misalnya, rencana pipa AI dan peningkatan hyperparameter).”
Untuk poin Stacey tentang kemajuan yang dibuat oleh raksasa teknologi lain di bidang ini, saya akan menambahkan bahwa AutoML terkait tetapi merupakan bidang terpisah dalam upaya keseluruhan untuk meningkatkan kecerdasan buatan. Raksasa teknologi lebih peduli untuk membuat arsitektur pembelajaran mendalam mereka menjadi lebih baik. Dapat dikatakan bahwa AutoML dapat diperluas untuk membantu dalam memilih penyetelan hyperparameter yang optimal dan arsitektur jaringan saraf yang dalam—tantangan yang jauh lebih menantang daripada satu alamat AutoML dengan jaringan non-deep learning.
Makalah DeepMind baru-baru ini (seperti Elastic Weight Consolidation atau Neural Episodic Control) menunjukkan bahwa tujuan utama raksasa teknologi ini adalah untuk menciptakan memori dalam mesin ini untuk membebaskan mereka dari tugas-tugas khusus. Ini masuk akal bagi saya. Upaya ini, pada dasarnya, menyoroti tren AI umum, yang memungkinkan mesin mengingat apa yang telah mereka pelajari dan menerapkannya pada keadaan baru. Itu bisa mendefinisikan ulang AutoML sebagai proses pembelajaran mesin otomatis jika itu tercapai. AutoML, di sisi lain, mengadopsi definisi yang lebih ketat untuk saat ini, tetapi masih menjanjikan.