AI/ML, Generative AI & Analytics
Service Picker
Belajar memilih layanan AWS yang tepat untuk OCR, suara, teks, gambar, chatbot, pencarian dokumen, ML platform, dan analytics.
AI/ML sebagai Kotak Peralatan Pintar
Untuk CLF-C02, yang paling penting adalah tahu alat mana untuk pekerjaan apa.
Bayangkan kamu punya bengkel modern: ada mesin pembaca dokumen, penerjemah, penyiar suara, kamera pintar, chatbot, mesin pencari dokumen, dan ruang kerja data scientist.
Di AWS, layanan AI/ML bukan satu produk tunggal. Ia seperti rak alat. Kalau masalahnya gambar, pilih alat gambar. Kalau masalahnya suara, pilih alat suara. Kalau masalahnya dokumen, pilih alat dokumen. Kalau masalahnya membangun model sendiri, baru masuk ke platform ML seperti Amazon SageMaker AI.
Jangan pakai palu untuk semua masalah. Dalam ujian, jangan menjawab SageMaker AI untuk semua soal AI/ML. Banyak soal hanya butuh layanan siap pakai seperti Textract, Transcribe, Translate, Polly, Rekognition, Comprehend, Lex, Kendra, atau Amazon Q.
Modul ini fokus pada service picker, yaitu kemampuan memilih layanan. Ini sangat cocok untuk CLF-C02 karena exam guide menekankan kemampuan mengidentifikasi layanan AWS untuk use case umum, bukan menulis kode ML atau melatih model kompleks.
Kenapa cara pikir kotak alat ini penting buatmu? Karena soal ujian jarang bertanya “jelaskan arsitektur model deep learning”. Soal lebih sering memberi sebuah cerita bisnis (sebuah marketplace, sebuah call center, sebuah tim finance) lalu meminta kamu menunjuk satu layanan paling tepat. Begitu kamu terbiasa membaca input dan output dari cerita itu, pilihan ganda yang tadinya mirip semua langsung mengerucut. Inilah keterampilan inti yang dilatih sepanjang modul ini.
CLF-C02 hanya mencantumkan 10 layanan Machine Learning (Comprehend, Kendra, Lex, Polly, Amazon Q, Rekognition, SageMaker AI, Textract, Transcribe, Translate) dan 7 layanan Analytics (Athena, EMR, Glue, Kinesis, OpenSearch Service, QuickSight, Redshift). Amazon Bedrock, Personalize, Forecast, Fraud Detector, Lake Formation, dan MSK boleh kamu kenali sekilas, tetapi tidak termasuk daftar in-scope, jadi jangan dipelajari mendalam untuk ujian ini.
Masukan berupa dokumen
Pakai Amazon Textract untuk mengambil teks, tabel, dan form dari dokumen.
Masukan berupa audio
Pakai Amazon Transcribe untuk mengubah suara menjadi teks, atau Amazon Polly untuk mengubah teks menjadi suara.
Masukan berupa gambar
Pakai Amazon Rekognition untuk analisis gambar dan video, seperti label, objek, wajah, dan moderasi konten.
Rujukan resmi yang relevan untuk modul ini: In-Scope AWS Services CLF-C02, Choosing an AWS machine learning service, dan What is Amazon SageMaker AI?.
Peta Mental: AI, ML, Generative AI, dan Analytics
Pisahkan dulu masalahnya: memahami, menghasilkan, memprediksi, atau menganalisis data.
Sebelum memilih layanan, tanyakan: apakah saya ingin mengenali sesuatu, membuat sesuatu, melatih model, mencari jawaban, atau menganalisis data?
AI siap pakai
Layanan dengan model yang sudah disiapkan AWS untuk tugas umum, seperti OCR, terjemahan, analisis sentimen, suara, gambar, dan chatbot berbasis intent.
Machine Learning platform
Lingkungan untuk membangun, melatih, menguji, dan menjalankan model sendiri. Untuk CLF-C02, kenali ini sebagai wilayah SageMaker AI.
Generative AI
AI yang dapat menghasilkan jawaban, ringkasan, teks, atau bantuan kerja berbasis prompt. Untuk modul ini, fokus ujian ada pada Amazon Q sebagai asisten generative AI.
Analytics
Layanan untuk mengolah, menanyakan, memvisualisasikan, atau mencari pola dari data, seperti Athena, Glue, Redshift, QuickSight, Kinesis, OpenSearch Service, dan EMR.
Kalau soal menyebut input dan output, cocokkan langsung. Gambar → Rekognition. PDF/form → Textract. Audio → Transcribe. Teks → Comprehend atau Translate. Teks ke audio → Polly. Chatbot intent → Lex.
Empat keluarga masalah
| Jenis masalah | Contoh pertanyaan bisnis | Layanan yang sering cocok |
|---|---|---|
| Mengenali | Apa isi gambar ini, apa isi dokumen ini, apa sentimen teks ini? | Rekognition, Textract, Comprehend |
| Mengubah format | Ubah suara ke teks, teks ke suara, bahasa A ke bahasa B. | Transcribe, Polly, Translate |
| Berinteraksi | Buat bot pemesanan, asisten dokumen internal, atau pencarian tanya jawab. | Lex, Amazon Q, Kendra |
| Menganalisis data | Query data di S3, buat dashboard, olah data besar, streaming log. | Athena, Glue, Redshift, QuickSight, Kinesis, EMR, OpenSearch Service |
Di ujian, kata kunci sering lebih penting daripada detail teknis. Kata image, video, objects, atau content moderation mengarah ke Rekognition. Kata forms, tables, scanned document, atau invoice mengarah ke Textract. Kata speech atau audio perlu dibaca hati-hati, apakah ingin menjadi teks atau menjadi suara.
Decision tree: dari satu pertanyaan ke satu layanan
Peta di atas bagus untuk gambaran besar, tetapi saat menghadapi soal kamu butuh alur yang lebih tegas: satu pertanyaan, satu cabang, satu jawaban. Pohon keputusan berikut menyusun pertanyaan paling membedakan lebih dulu (apa jenis input?), lalu menambahkan dua cabang lanjutan yang sering menentukan jawaban: apakah kamu butuh percakapan terstruktur, apakah kamu perlu membangun model sendiri, atau apakah kamu butuh asisten generative AI atas data perusahaan.
Baca soal, jawab pertanyaan paling atas dulu (apa input-nya), baru turun ke cabang berikutnya. Sebagian besar soal CLF-C02 selesai hanya di baris pertama (gambar, dokumen, audio, teks), tanpa perlu turun jauh.
Service Picker AI Siap Pakai
Layanan ini cocok saat kamu ingin memakai kemampuan AI tanpa membangun model dari nol.
AI siap pakai itu seperti memanggil spesialis: kamu kirim input, layanan mengembalikan hasil analisis.
Daftar cepat layanan AI/ML
| Layanan | Gunakan saat | Jangan tertukar dengan |
|---|---|---|
| Amazon Rekognition | Menganalisis gambar dan video, mendeteksi objek, label, wajah, teks di gambar, atau konten tidak pantas. | Textract, karena Textract khusus dokumen dan struktur seperti tabel/form. |
| Amazon Textract | Mengekstrak teks, handwriting, tabel, form, key-value, invoice, receipt, atau data dari dokumen. | Rekognition, karena Rekognition tidak fokus pada struktur dokumen bisnis. |
| Amazon Comprehend | Menganalisis teks, seperti sentimen, entitas, frasa kunci, bahasa dominan, topik, dan PII. | Translate, karena Translate mengubah bahasa, bukan memahami makna bisnis teks. |
| Amazon Translate | Menerjemahkan teks atau dokumen antar bahasa untuk aplikasi multibahasa. | Comprehend, karena Comprehend memahami isi teks, bukan menerjemahkan. |
| Amazon Transcribe | Mengubah audio atau percakapan menjadi teks. | Polly, karena Polly adalah arah sebaliknya. |
| Amazon Polly | Mengubah teks menjadi suara yang terdengar natural untuk aplikasi, pembaca artikel, atau IVR. | Transcribe, karena Transcribe mengubah suara menjadi teks. |
| Amazon Lex | Membangun chatbot atau voice bot berbasis intent, slot, dan alur percakapan. | Amazon Q, karena Q adalah asisten generative AI, bukan hanya bot intent tradisional. |
| Amazon Kendra | Membangun pencarian cerdas atas dokumen perusahaan dengan pemahaman bahasa natural. | OpenSearch Service, karena OpenSearch lebih umum untuk search, log analytics, dan observability. |
Soal CLF-C02 sering meminta layanan paling managed dan paling langsung. Bila ada layanan siap pakai yang cocok, pilih itu sebelum memilih SageMaker AI.
Rekognition: kamera pintar
Gunakan Amazon Rekognition ketika inputnya gambar atau video. Contoh nyata: marketplace ingin mendeteksi gambar produk yang melanggar kebijakan, aplikasi event ingin mengenali wajah peserta yang terdaftar, atau sistem keamanan ingin mencari objek tertentu pada video.
Kalau soal menyebut dokumen PDF berisi tabel invoice, itu bukan Rekognition walaupun file itu bisa terlihat sebagai gambar. Kata tabel, form, invoice, receipt, dan key-value mengarah ke Textract.
Textract: petugas input data super cepat
Amazon Textract membantu membaca dokumen seperti manusia admin yang menyalin isi formulir, tetapi dilakukan secara otomatis. Ia cocok untuk proses klaim asuransi, KYC, invoice vendor, medical form, dan dokumen pajak.
Comprehend: pembaca makna teks
Amazon Comprehend cocok untuk membaca teks dan menemukan makna, seperti apakah review pelanggan positif, siapa nama orang atau organisasi yang disebut, bahasa apa yang digunakan, atau apakah teks mengandung informasi pribadi (PII).
Ini distraktor lintas-domain yang sering muncul. Comprehend mendeteksi dan menyamarkan PII pada teks yang kamu kirim ke layanan (mis. isi dokumen atau pesan). Amazon Macie (layanan keamanan) menemukan data sensitif yang sudah tersimpan di bucket Amazon S3. Soal “temukan PII di seluruh bucket S3” mengarah ke Macie, bukan Comprehend. Soal “deteksi atau redaksi PII di dalam teks ini” mengarah ke Comprehend.
Translate, Transcribe, dan Polly: trio pengubah bentuk bahasa
Amazon Translate mengubah bahasa. Amazon Transcribe mengubah suara menjadi teks. Amazon Polly mengubah teks menjadi suara. Ingat arah panahnya karena ini sering menjadi jebakan, dan exam sering membalik arah ini.
Bayangkan studio podcast. Transcribe adalah juru ketik yang menyalin rekaman menjadi naskah. Polly adalah penyiar yang membaca naskah dengan suara natural. Translate adalah penerjemah yang mengganti bahasa naskah tanpa mengubah ceritanya. Tiga peran berbeda, tiga arah berbeda.
Lex dan Kendra: percakapan dan pencarian
Amazon Lex cocok untuk chatbot yang menanyakan niat pengguna dan mengumpulkan informasi, misalnya booking hotel, cek status pesanan, atau memilih menu IVR. Amazon Kendra cocok ketika pengguna ingin mencari jawaban dari kumpulan dokumen internal, bukan sekadar keyword matching.
Pola cepat AI siap pakai
- Gambar/video → Rekognition.
- Dokumen/form/tabel → Textract.
- Sentimen/entitas/frasa kunci/PII dalam teks → Comprehend.
- Terjemahan → Translate.
- Audio ke teks → Transcribe.
- Teks ke suara → Polly.
- Chatbot intent dan slot → Lex.
- Pencarian cerdas dokumen → Kendra.
Generative AI dan Amazon Q
Amazon Q membantu pengguna bertanya, merangkum, membuat konten, dan menyelesaikan tugas dengan data perusahaan.
Kalau AI siap pakai seperti alat spesialis, Amazon Q seperti asisten kerja yang bisa diajak bertanya dalam bahasa natural.
Amazon Q adalah keluarga kemampuan generative AI dari AWS. Untuk pemula CLF-C02, bayangkan Amazon Q sebagai asisten yang membantu pengguna menemukan informasi, merangkum dokumen, menjawab pertanyaan, menulis konten, atau membantu pekerjaan developer dan bisnis, bergantung varian dan integrasinya.
Kalau Kendra seperti mesin pencari dokumen, Amazon Q seperti rekan kerja yang membaca dokumen yang boleh ia akses, lalu menjawab pertanyaan dengan konteks dan bisa membantu melakukan tugas.
Amazon Q Business
Asisten generative AI untuk data perusahaan, dengan jawaban yang memperhatikan izin akses pengguna dan dapat menyertakan rujukan dari sumber perusahaan. Memakai subscription per user, tanpa free tier permanen.
Amazon Q Developer
Asisten untuk developer dan operator cloud, misalnya membantu memahami AWS, menulis kode, menjelaskan error, atau mempercepat pekerjaan teknis. Punya Free Tier permanen, lalu tier Pro per user.
Amazon Q in QuickSight
Kemampuan natural language di area analytics, misalnya bertanya tentang data dalam bahasa biasa lalu mendapat insight dan ringkasan langsung di dashboard.
Amazon Q bukan sekadar search
Search mengembalikan dokumen. Asisten generative AI dapat merangkum, menjelaskan, menyusun jawaban, dan membantu tindakan sesuai integrasi.
Which Q? Petunjuk cepat di soal
| Petunjuk di soal | Varian | Cue pembeda |
|---|---|---|
| Asisten internal untuk karyawan: HR, IT, kebijakan, knowledge base. | Q Business | End users, permission-aware, subscription per user, tanpa free tier. |
| Bantu developer menulis kode, menjelaskan error, atau tugas dev di IDE/CLI. | Q Developer | Builders, ada Free Tier permanen, tugas coding dan cloud. |
| Analis bertanya ke data pakai bahasa natural di dashboard. | Q in QuickSight | Natural language BI, ringkasan dan insight di QuickSight. |
- Pengguna sasaran: karyawan non-teknis yang bertanya tentang data perusahaan.
- Jawaban permission-aware, menghormati izin akses tiap pengguna.
- Pemakaian umum: HR, IT help desk, kebijakan, onboarding, knowledge base.
- Model harga: subscription per user (Lite atau Pro), tanpa free tier permanen.
- Pengguna sasaran: developer dan operator cloud di IDE, CLI, atau console.
- Membantu menulis kode, menjelaskan error, dan menjalankan tugas dev agentic.
- Pemakaian umum: percepat coding, pahami AWS, transformasi/upgrade kode.
- Model harga: ada Free Tier permanen, lalu tier Pro per user.
Kapan pilih Amazon Q?
Ketika user ingin bertanya dalam bahasa natural kepada data atau dokumen perusahaan.
Ketika organisasi ingin asisten internal untuk HR, IT help desk, kebijakan perusahaan, knowledge base, atau produktivitas kerja.
Ketika kebutuhan bukan sekadar menemukan file, tetapi merangkum dan menjawab berdasarkan konteks.
Ketika jawaban harus mempertimbangkan izin akses pengguna, bukan semua orang melihat semua data.
Amazon Q vs Kendra vs Lex
| Kebutuhan | Pilih | Kenapa |
|---|---|---|
| Pengguna ingin mencari jawaban dari dokumen dengan pencarian semantik. | Kendra | Fokus pada intelligent search dan retrieval dokumen. |
| Pengguna ingin asisten generative AI yang menjawab, merangkum, dan membantu tugas berbasis data perusahaan. | Amazon Q | Fokus pada asisten generative AI yang terhubung ke enterprise data. |
| Pengguna ingin bot percakapan terstruktur untuk memesan, memilih menu, atau mengisi slot informasi. | Lex | Fokus pada intent, slot, dan alur percakapan. |
Kalau soal menyebut generative AI assistant untuk data perusahaan, pikirkan Amazon Q. Kalau soal menyebut intelligent search atas dokumen, pikirkan Kendra. Kalau soal menyebut chatbot dengan intent dan slot, pikirkan Lex.
Tangga: search, intelligent search, lalu asisten
Ketiganya terlihat mirip karena sama-sama berurusan dengan dokumen, tetapi mereka berada di tangga yang berbeda. OpenSearch Service kuat untuk pencarian berbasis indeks dan analisis log. Kendra naik satu tingkat dengan pencarian cerdas yang memahami pertanyaan bahasa natural dan mengembalikan jawaban atau passage relevan. Amazon Q naik lagi: ia tidak hanya menemukan, tetapi merangkum, menjelaskan, dan menyusun jawaban. Menariknya, sejak Kendra punya GenAI Index, Kendra bisa menjadi retriever yang memberi bahan kepada Amazon Q.
Di mana posisi Amazon Bedrock?
Amazon Bedrock adalah layanan untuk membangun aplikasi generative AI di atas foundation model (memilih model, menambah knowledge base, membuat agent). Ia kuat dan penting di dunia nyata, tetapi tidak termasuk daftar in-scope Machine Learning CLF-C02. Untuk ujian ini, fokus generative AI ada pada Amazon Q (asisten siap pakai) dan SageMaker AI (platform model). Bedrock yang mendalam adalah materi ujian AIF-C01 dan AIP-C01, bukan CLF-C02. Jadi bila Bedrock muncul sebagai pilihan jawaban di soal bergaya CLF-C02, ia biasanya distraktor.
SageMaker AI untuk Platform ML
Pilih SageMaker AI ketika tim perlu membangun, melatih, dan menjalankan model ML sendiri.
SageMaker AI adalah dapur profesional untuk data scientist, bukan sekadar blender otomatis untuk satu tugas.
Amazon SageMaker AI adalah layanan fully managed untuk membangun, melatih, dan men-deploy model machine learning dan foundation model ke environment produksi yang dikelola AWS.
Pada 3 Desember 2024 AWS mengganti nama Amazon SageMaker menjadi Amazon SageMaker AI (rename ini tidak mengubah API, CLI, atau endpoint lama, jadi tetap kompatibel). Di hari yang sama AWS juga merilis “next generation of Amazon SageMaker”, yaitu platform terpadu untuk data, analytics, dan AI (mencakup SageMaker Unified Studio, Lakehouse, Catalog, dan Bedrock). Untuk ujian: soal tentang membangun, melatih, atau men-deploy model menjawab SageMaker AI (layanan model), bukan SageMaker Unified Studio (platform terpadu).
Kalau Rekognition, Textract, dan Polly adalah makanan siap saji untuk kebutuhan spesifik, SageMaker AI adalah dapur lengkap untuk membuat resep model sendiri dari bahan data yang kamu punya.
Build
Data scientist dapat menyiapkan notebook, data, eksperimen, dan kode ML.
Train
Model dilatih memakai data dan compute yang sesuai, tanpa harus merakit server sendiri dari nol.
Deploy
Model dapat dijalankan sebagai endpoint atau alur produksi agar aplikasi bisa meminta prediksi.
Kapan SageMaker AI paling masuk akal?
Perusahaan punya data unik dan ingin model yang disesuaikan, misalnya fraud detection khusus pola transaksi internal.
Tim perlu kontrol lebih besar atas pelatihan, eksperimen, model, deployment, dan MLOps.
Layanan AI siap pakai tidak cukup karena domainnya spesifik, misalnya prediksi risiko berdasarkan data industri tertentu.
Organisasi punya data scientist atau ML engineer yang memang akan mengelola siklus hidup model.
Kapan jangan pilih SageMaker AI?
| Use case | Jawaban yang lebih langsung | Alasan |
|---|---|---|
| Mendeteksi objek dalam gambar produk. | Rekognition | Model computer vision siap pakai sudah cukup. |
| Mengambil data dari invoice PDF. | Textract | Fokus pada dokumen, tabel, form, dan key-value. |
| Menerjemahkan review pelanggan. | Translate | Tugasnya translation, bukan custom ML. |
| Mengubah rekaman call center menjadi teks. | Transcribe | Tugasnya automatic speech recognition. |
| Membuat bot pemesanan sederhana. | Lex | Intent dan slot lebih sesuai daripada membangun model sendiri. |
Pilih SageMaker AI jika soal menekankan membangun, melatih, tuning, deployment model sendiri, atau kebutuhan custom ML. Pilih layanan AI siap pakai jika soal menggambarkan tugas umum yang sudah disediakan AWS.
Analytics Picker: Kapan Pakai Apa?
Analytics dipakai ketika masalahnya bukan hanya AI, tetapi mengolah dan memahami data dalam skala bisnis.
Kalau AI menjawab pertanyaan spesifik, analytics membantu melihat pola besar dari data yang terus bertambah.
Dalam CLF-C02, layanan analytics yang perlu dikenal tepat 7: Amazon Athena, Amazon EMR, AWS Glue, Amazon Kinesis, Amazon OpenSearch Service, Amazon QuickSight, dan Amazon Redshift. Fokusnya adalah memahami kapan memilih masing-masing, bukan menghafal konfigurasi cluster.
| Layanan analytics | Gunakan saat | Analogi cepat |
|---|---|---|
| Amazon Athena | Ingin menjalankan query SQL langsung ke data di Amazon S3 tanpa menyiapkan server database. | Meja tanya jawab cepat untuk data lake. |
| AWS Glue | Ingin menemukan, mengatalogkan, membersihkan, mengubah, dan memindahkan data untuk analytics atau ML. | Petugas ETL dan katalog perpustakaan data. |
| Amazon Redshift | Butuh data warehouse terkelola untuk analisis data besar, dashboard, dan query bisnis yang berat. | Gudang data analitik perusahaan. |
| Amazon QuickSight | Ingin membuat dashboard, visualisasi, laporan, dan BI untuk pengguna bisnis. | Panel indikator bisnis. |
| Amazon Kinesis | Ingin mengumpulkan dan memproses data streaming hampir real-time, seperti clickstream, IoT, atau log aplikasi. | Sungai data yang terus mengalir. |
| Amazon OpenSearch Service | Butuh search, log analytics, observability, atau analisis data berbasis indeks. | Mesin pencari dan kaca pembesar log. |
| Amazon EMR | Butuh pemrosesan big data memakai framework seperti Apache Spark atau Hadoop. | Pabrik pemrosesan data skala besar. |
Data mentah di S3 bisa dikatalogkan oleh Glue, ditanya dengan Athena, diolah besar dengan EMR, dimasukkan ke Redshift untuk data warehouse, lalu divisualisasikan dengan QuickSight.
Kinesis dan Amazon Data Firehose
”Amazon Kinesis” adalah payung in-scope CLF-C02 untuk data streaming. Di bawahnya ada dua hal yang berguna kamu bedakan: Kinesis Data Streams untuk menangkap dan memproses data secara real-time, dan Amazon Data Firehose untuk mengirim (deliver) stream itu ke tujuan seperti S3, Redshift, atau OpenSearch Service. Catatan nama: sejak 9 Februari 2024, “Kinesis Data Firehose” berganti nama menjadi Amazon Data Firehose (hanya nama yang berubah). Pakai nama baru ini di materi 2026.
Athena vs Redshift: pasangan yang sering tertukar
Keduanya menjalankan SQL untuk analitik, tetapi modelnya berbeda. Athena serverless dan bayar per query langsung di atas data S3, ideal untuk pertanyaan ad hoc yang tidak rutin. Redshift adalah data warehouse terkelola yang kamu provisioning untuk beban BI berat dan berulang dalam skala besar.
- Serverless, tanpa cluster yang perlu dikelola.
- SQL langsung di atas data S3, tidak perlu memindahkan data dulu.
- Model biaya: bayar per query (per data yang dipindai).
- Cocok untuk analisis ad hoc, sesekali, atau eksplorasi cepat.
- Data warehouse terkelola yang di-provisioning.
- Data dimuat ke dalam warehouse untuk performa kueri yang konsisten.
- Model biaya: kapasitas warehouse yang berjalan.
- Cocok untuk BI berat, berulang, dan analitik skala besar.
Soal yang menyebut serverless, ad hoc, pay-per-query, atau SQL langsung di S3 mengarah ke Athena. Soal yang menyebut data warehouse, BI workload berat, atau analitik skala besar yang berulang mengarah ke Redshift.
Service picker analytics paling sering
Query ad hoc data di S3
Pilih Athena. Kata kunci: SQL, S3, serverless query, ad hoc analysis.
ETL dan katalog data
Pilih Glue. Kata kunci: crawl, catalog, transform, prepare, ETL.
Data warehouse
Pilih Redshift. Kata kunci: petabyte-scale warehouse, BI workload, analytical queries.
Dashboard bisnis
Pilih QuickSight. Kata kunci: visualization, dashboard, BI, reports.
Streaming data
Pilih Kinesis. Kata kunci: real-time stream, clickstream, logs, telemetry.
Search dan log analytics
Pilih OpenSearch Service. Kata kunci: indexing, full-text search, log search, observability.
Cara Kerja End-to-End
Banyak solusi nyata menggabungkan AI/ML dan analytics dalam satu alur.
Di dunia nyata, satu layanan jarang bekerja sendirian. Dokumen, audio, gambar, dan log biasanya masuk ke storage, diproses, lalu dianalisis.
Contoh alur klaim asuransi
Nasabah mengunggah foto formulir klaim, kuitansi, dan rekaman percakapan layanan pelanggan.
Textract mengekstrak teks, tabel, dan key-value dari formulir atau kuitansi.
Comprehend mendeteksi entitas, frasa penting, sentimen, atau data pribadi yang perlu dilindungi.
Rekaman call center diubah menjadi teks agar bisa dicari dan dianalisis.
Glue mengatalogkan dan membersihkan data agar siap dianalisis.
Athena cocok untuk query langsung di S3, Redshift cocok untuk data warehouse dan analisis bisnis berat.
Manajer melihat tren klaim, waktu proses, biaya, dan area risiko.
AI/ML tidak menghapus tanggung jawab keamanan. Perhatikan IAM, enkripsi, logging, data sensitif, izin akses, dan kepatuhan ketika memproses dokumen, audio, gambar, atau data pelanggan.
Polanya sederhana
Masukan → ekstraksi atau pemahaman → penyimpanan → transformasi → query → visualisasi atau asisten. Kalau kamu bisa membaca alur ini, soal service picker akan terasa jauh lebih mudah.
Skenario Nyata dan Pilihan Layanan
Latih diri dengan membaca kebutuhan bisnis, lalu pilih layanan paling langsung.
Bagian ini adalah latihan membaca soal. Fokus pada kata kunci, bukan pada nama layanan yang terdengar paling canggih.
Skenario 1: Marketplace skincare ingin moderasi gambar produk
Tim marketplace ingin mendeteksi gambar tidak pantas, gambar produk palsu, dan objek tertentu pada foto listing. Pilihan paling tepat adalah Amazon Rekognition, karena inputnya gambar dan tujuannya computer vision.
Skenario 2: Finance ingin mengambil data dari invoice vendor
Invoice berisi nomor invoice, tanggal, total, tabel item, dan data vendor. Pilihan paling tepat adalah Amazon Textract, karena fokusnya ekstraksi dokumen, form, tabel, dan key-value.
Skenario 3: Customer support ingin tahu sentimen review
Review produk dalam bentuk teks perlu diberi label positif, negatif, netral, atau mixed. Pilihan paling tepat adalah Amazon Comprehend, karena fokusnya natural language processing dan sentiment analysis.
Skenario 4: Call center ingin membuat transkrip percakapan
Rekaman audio pelanggan perlu diubah menjadi teks. Pilihan paling tepat adalah Amazon Transcribe. Setelah menjadi teks, kamu bisa memakai Comprehend untuk memahami sentimen atau entitas.
Skenario 5: Aplikasi belajar ingin membacakan artikel
Artikel teks ingin diubah menjadi suara agar lebih aksesibel. Pilihan paling tepat adalah Amazon Polly, karena output yang diinginkan adalah speech.
Skenario 6: Perusahaan ingin chatbot untuk booking jadwal
Bot perlu bertanya tanggal, jam, lokasi, dan tujuan meeting. Pilihan paling tepat adalah Amazon Lex, karena ada intent dan slot yang jelas.
Skenario 7: Karyawan ingin bertanya ke dokumen internal
Jika kebutuhannya pencarian cerdas atas dokumen, pilih Amazon Kendra. Jika kebutuhannya asisten generative AI yang menjawab, merangkum, dan membantu tugas berbasis data perusahaan, pilih Amazon Q.
Skenario 8: Data analyst ingin query log di S3
Log aplikasi sudah tersimpan di Amazon S3 dan analyst ingin menjalankan SQL ad hoc. Pilihan paling tepat adalah Amazon Athena, sering dibantu AWS Glue Data Catalog untuk metadata.
Skenario 9: Manajemen ingin dashboard penjualan
Data sudah siap dianalisis dan pengguna bisnis ingin dashboard interaktif. Pilihan paling tepat adalah Amazon QuickSight. Jika datanya besar dan kompleks sebagai warehouse, Amazon Redshift dapat menjadi sumber analitiknya.
Setiap skenario punya kata benda penting: gambar, dokumen, audio, teks, chatbot, pencarian, dashboard, streaming, warehouse. Kata benda itu biasanya mengarahkan jawaban.
Hands-on Ringan dan Walkthrough Konseptual
Tujuannya membangun intuisi, bukan membuat proyek produksi.
Hands-on terbaik untuk pemula adalah mencoba beberapa layanan melalui console dengan input kecil dan memahami outputnya.
Sebelum mencoba layanan apa pun, selalu cek halaman pricing resmi, region yang dipakai, dan hapus resource atau data uji setelah selesai. Jangan menghafal angka harga untuk ujian kecuali diminta sumber resmi terbaru.
Kamu tidak perlu hafal angka, tetapi kenali polanya. Layanan AI menagih per satuan pemakaian: per karakter teks (Comprehend, Translate, Polly), per menit audio (Transcribe), per halaman dokumen (Textract), atau per gambar/menit video (Rekognition). Untuk asisten: Amazon Q Developer punya Free Tier permanen, sedangkan Amazon Q Business tidak punya free tier dan ditagih subscription per user. Pola ini cukup untuk soal billing CLF-C02.
Walkthrough 1: Bedakan Rekognition dan Textract
Satu foto produk, satu gambar invoice atau formulir sederhana.
Output yang dicari adalah label objek, scene, atau moderasi konten.
Output yang dicari adalah teks, tabel, field, dan pasangan key-value.
Rekognition memahami visual umum, Textract memahami struktur dokumen.
Walkthrough 2: Rangkai bahasa pelanggan
Review berbahasa asing masuk sebagai teks mentah.
Terjemahkan teks ke bahasa kerja tim support.
Deteksi sentimen, entitas, frasa kunci, atau PII dari teks.
Ubah ringkasan teks menjadi audio untuk fitur aksesibilitas atau notifikasi suara.
Walkthrough 3: Bangun alur analytics sederhana
Anggap file CSV penjualan disimpan di bucket S3.
Crawler Glue menemukan skema dan menyimpan definisi tabel di Data Catalog.
Analyst menanyakan total penjualan per kategori tanpa membuat database server.
Hasil analisis divisualisasikan agar mudah dipahami manajemen.
Checklist observasi
Apa input utamanya: teks, audio, gambar, dokumen, atau data tabular?
Apa output yang diinginkan: label, transkrip, terjemahan, suara, sentimen, dashboard, atau prediksi?
Apakah cukup memakai AI siap pakai, atau perlu membangun model sendiri?
Apakah data sensitif perlu enkripsi, kontrol akses, audit, atau masking?
Apakah workload hanya batch, streaming, pencarian, dashboard, atau data warehouse?
Kesalahan Umum dan Jebakan Soal
Mayoritas kesalahan pemula berasal dari memilih layanan yang terlalu besar atau salah arah input-output.
Jebakan utama: semua yang berbau AI dijawab SageMaker AI. Padahal CLF-C02 lebih sering menguji pemilihan layanan siap pakai.
Kesalahan umum pemula
Memilih SageMaker AI untuk semua AI
Gunakan SageMaker AI untuk custom ML. Untuk tugas umum, pilih layanan siap pakai yang lebih langsung.
Tertukar Transcribe dan Polly
Transcribe adalah audio ke teks. Polly adalah teks ke audio.
Tertukar Rekognition dan Textract
Rekognition untuk gambar/video umum. Textract untuk dokumen, form, tabel, dan key-value.
Tertukar Comprehend dan Translate
Comprehend memahami teks. Translate menerjemahkan teks.
Tertukar Lex dan Amazon Q
Lex untuk bot intent/slot. Amazon Q untuk asisten generative AI berbasis konteks dan data.
Tertukar Athena dan Redshift
Athena query langsung data di S3. Redshift adalah data warehouse terkelola untuk analitik skala besar.
Tertukar Comprehend dan Macie
Comprehend deteksi/redaksi PII dalam teks yang kamu kirim. Macie temukan data sensitif yang tersimpan di S3.
Memilih Bedrock di soal CLF-C02
Bedrock bukan in-scope CLF-C02. Untuk generative AI, jawaban yang dimaksud biasanya Amazon Q atau SageMaker AI.
Tertukar Kendra dan OpenSearch
Kendra intelligent search untuk tanya jawab dokumen. OpenSearch full-text search, log analytics, dan observability.
Jebakan pilihan jawaban
| Kata di soal | Jawaban cenderung benar | Distractor yang sering menggoda |
|---|---|---|
| Detect unsafe images, labels, faces, objects | Rekognition | SageMaker AI |
| Extract tables from scanned forms | Textract | Rekognition |
| Customer sentiment from text | Comprehend | Translate |
| Translate content to another language | Translate | Comprehend |
| Convert call recording to text | Transcribe | Polly |
| Convert article text to spoken audio | Polly | Transcribe |
| Chatbot with intents and slots | Lex | Amazon Q |
| Enterprise assistant that answers from company data | Amazon Q | Lex |
| SQL query on S3 data | Athena | Redshift |
| Business dashboard and BI | QuickSight | Glue |
| Discover PII across S3 buckets | Macie | Comprehend |
| Detect or redact PII inside this text | Comprehend | Macie |
| Intelligent search Q&A over documents | Kendra | OpenSearch Service |
| Build/train/deploy a custom ML model | SageMaker AI | Rekognition |
| Build GenAI app on foundation models | Bedrock (bukan in-scope) | Amazon Q |
Eliminasi jawaban yang terlalu teknis bila soal meminta solusi managed dan siap pakai. Untuk CLF-C02, layanan yang paling sederhana dan tepat guna sering menjadi jawaban terbaik.
Jebakan keamanan dan biaya
AI/ML tetap membutuhkan IAM permission yang benar. Jangan memberi akses data lebih luas dari kebutuhan.
Dokumen, audio, dan gambar pelanggan bisa berisi data sensitif. Pertimbangkan enkripsi, logging, data retention, dan masking.
Beberapa layanan menagih berdasarkan karakter, durasi audio, halaman dokumen, request, compute, storage, indeks, atau user subscription. Untuk praktik, selalu cek pricing resmi.
Region dan ketersediaan fitur bisa berbeda. Jangan mengklaim semua fitur tersedia di semua region tanpa verifikasi.
Ringkasan & Tips Ujian
Pegang pola input-output, lalu petakan ke domain CLF-C02.
Untuk lulus bagian AI/ML dan analytics di CLF-C02, kamu tidak perlu menjadi data scientist. Kamu perlu menjadi pemilih alat yang rapi.
Poin Penting
- Rekognition untuk gambar dan video.
- Textract untuk OCR dokumen, form, tabel, dan key-value.
- Comprehend untuk memahami teks, seperti sentimen, entitas, frasa kunci, bahasa, dan PII (ingat Macie untuk PII di S3).
- Translate untuk menerjemahkan teks antar bahasa.
- Transcribe untuk audio menjadi teks, Polly untuk teks menjadi suara (ingat arah panahnya).
- Lex untuk chatbot berbasis intent dan slot.
- Kendra untuk pencarian cerdas dokumen, beda dari OpenSearch Service yang untuk full-text search dan log analytics.
- Amazon Q untuk asisten generative AI: Q Business (end users, permission-aware), Q Developer (builders, ada Free Tier), Q in QuickSight (natural language BI).
- SageMaker AI untuk membangun, melatih, dan menjalankan model ML custom (nama baru sejak Des 2024 untuk Amazon SageMaker).
- Athena, EMR, Glue, Kinesis, OpenSearch Service, QuickSight, dan Redshift adalah 7 layanan analytics in-scope; pilih berdasarkan pola data dan tujuan analisis.
- Bedrock, Personalize, Forecast, Fraud Detector, Lake Formation, dan MSK bukan in-scope CLF-C02, cukup dikenali sekilas.
Pemetaan ke domain CLF-C02
| Domain | Bobot | Kaitan dengan modul ini |
|---|---|---|
| Domain 1: Cloud Concepts | 24% | AI siap pakai menunjukkan value cloud: tidak perlu membangun model dan infrastruktur dari nol. |
| Domain 2: Security and Compliance | 30% | Data AI/ML bisa sensitif. Pahami IAM, enkripsi, audit, privacy, dan shared responsibility saat memproses data pelanggan. |
| Domain 3: Cloud Technology and Services | 34% | Ini domain paling relevan untuk service picker AI/ML dan analytics. Hafalkan use case, bukan detail implementasi. |
| Domain 4: Billing, Pricing, and Support | 12% | Pahami bahwa model biaya berbeda per layanan, seperti request, karakter, durasi, halaman, compute, storage, indeks, atau pengguna. |
Rumus cepat 30 detik
Apakah inputnya gambar, video, dokumen, audio, teks, data stream, data S3, atau data warehouse?
Apakah ingin label, teks, suara, terjemahan, sentimen, pencarian, jawaban generative AI, dashboard, atau prediksi?
Jangan memilih SageMaker AI bila layanan siap pakai sudah menyelesaikan masalah.
Perhatikan data sensitif, izin akses, region, logging, dan model penagihan.
Di CLF-C02, jawaban terbaik biasanya bukan yang paling canggih, tetapi yang paling sesuai dengan kata kunci use case, paling managed, dan paling sederhana untuk kebutuhan bisnis.