Web Artisan

CLF-C02

AI/ML, Generative AI & Analytics Service Picker

Panduan memilih layanan AI/ML, generative AI, dan analytics AWS sesuai use case CLF-C02.

Read ~75 menit baca

Modul · Machine Learning

AI/ML, Generative AI & Analytics
Service Picker

Belajar memilih layanan AWS yang tepat untuk OCR, suara, teks, gambar, chatbot, pencarian dokumen, ML platform, dan analytics.

Target: CLF-C02~75 menit bacaDomain 3 · 34%
01

AI/ML sebagai Kotak Peralatan Pintar

Untuk CLF-C02, yang paling penting adalah tahu alat mana untuk pekerjaan apa.

Bayangkan kamu punya bengkel modern: ada mesin pembaca dokumen, penerjemah, penyiar suara, kamera pintar, chatbot, mesin pencari dokumen, dan ruang kerja data scientist.

Di AWS, layanan AI/ML bukan satu produk tunggal. Ia seperti rak alat. Kalau masalahnya gambar, pilih alat gambar. Kalau masalahnya suara, pilih alat suara. Kalau masalahnya dokumen, pilih alat dokumen. Kalau masalahnya membangun model sendiri, baru masuk ke platform ML seperti Amazon SageMaker AI.

🧰Analogi kotak alat

Jangan pakai palu untuk semua masalah. Dalam ujian, jangan menjawab SageMaker AI untuk semua soal AI/ML. Banyak soal hanya butuh layanan siap pakai seperti Textract, Transcribe, Translate, Polly, Rekognition, Comprehend, Lex, Kendra, atau Amazon Q.

Modul ini fokus pada service picker, yaitu kemampuan memilih layanan. Ini sangat cocok untuk CLF-C02 karena exam guide menekankan kemampuan mengidentifikasi layanan AWS untuk use case umum, bukan menulis kode ML atau melatih model kompleks.

Kenapa cara pikir kotak alat ini penting buatmu? Karena soal ujian jarang bertanya “jelaskan arsitektur model deep learning”. Soal lebih sering memberi sebuah cerita bisnis (sebuah marketplace, sebuah call center, sebuah tim finance) lalu meminta kamu menunjuk satu layanan paling tepat. Begitu kamu terbiasa membaca input dan output dari cerita itu, pilihan ganda yang tadinya mirip semua langsung mengerucut. Inilah keterampilan inti yang dilatih sepanjang modul ini.

📌Cakupan resmi CLF-C02 (penting)

CLF-C02 hanya mencantumkan 10 layanan Machine Learning (Comprehend, Kendra, Lex, Polly, Amazon Q, Rekognition, SageMaker AI, Textract, Transcribe, Translate) dan 7 layanan Analytics (Athena, EMR, Glue, Kinesis, OpenSearch Service, QuickSight, Redshift). Amazon Bedrock, Personalize, Forecast, Fraud Detector, Lake Formation, dan MSK boleh kamu kenali sekilas, tetapi tidak termasuk daftar in-scope, jadi jangan dipelajari mendalam untuk ujian ini.

Masukan berupa dokumen

Pakai Amazon Textract untuk mengambil teks, tabel, dan form dari dokumen.

Masukan berupa audio

Pakai Amazon Transcribe untuk mengubah suara menjadi teks, atau Amazon Polly untuk mengubah teks menjadi suara.

Masukan berupa gambar

Pakai Amazon Rekognition untuk analisis gambar dan video, seperti label, objek, wajah, dan moderasi konten.

In-Scope CLF-C02 vs Sekadar Tahu Hijau = wajib dikuasai, abu-abu = boleh tahu tapi tidak diuji di CLF-C02 10 Machine Learning (wajib) Comprehend Kendra Lex Polly Amazon Q Rekognition SageMaker AI Textract Transcribe Translate 7 Analytics (wajib) Athena EMR Glue Kinesis OpenSearch Service QuickSight Redshift Sekadar tahu (bukan in-scope) Bedrock Personalize Forecast Fraud Detector Lake Formation MSK Data Firehose: nama baru dari Kinesis Data Firehose, masuk di bawah payung Kinesis
Gambar 1. Peta cakupan CLF-C02: 10 layanan ML dan 7 layanan Analytics yang wajib (hijau), versus layanan yang hanya perlu diketahui (abu-abu).

Rujukan resmi yang relevan untuk modul ini: In-Scope AWS Services CLF-C02, Choosing an AWS machine learning service, dan What is Amazon SageMaker AI?.

02

Peta Mental: AI, ML, Generative AI, dan Analytics

Pisahkan dulu masalahnya: memahami, menghasilkan, memprediksi, atau menganalisis data.

Sebelum memilih layanan, tanyakan: apakah saya ingin mengenali sesuatu, membuat sesuatu, melatih model, mencari jawaban, atau menganalisis data?

AI siap pakai

Layanan dengan model yang sudah disiapkan AWS untuk tugas umum, seperti OCR, terjemahan, analisis sentimen, suara, gambar, dan chatbot berbasis intent.

Machine Learning platform

Lingkungan untuk membangun, melatih, menguji, dan menjalankan model sendiri. Untuk CLF-C02, kenali ini sebagai wilayah SageMaker AI.

Generative AI

AI yang dapat menghasilkan jawaban, ringkasan, teks, atau bantuan kerja berbasis prompt. Untuk modul ini, fokus ujian ada pada Amazon Q sebagai asisten generative AI.

Analytics

Layanan untuk mengolah, menanyakan, memvisualisasikan, atau mencari pola dari data, seperti Athena, Glue, Redshift, QuickSight, Kinesis, OpenSearch Service, dan EMR.

💡Pertanyaan pemilih layanan

Kalau soal menyebut input dan output, cocokkan langsung. Gambar → Rekognition. PDF/form → Textract. Audio → Transcribe. Teks → Comprehend atau Translate. Teks ke audio → Polly. Chatbot intent → Lex.

Empat keluarga masalah

Jenis masalahContoh pertanyaan bisnisLayanan yang sering cocok
MengenaliApa isi gambar ini, apa isi dokumen ini, apa sentimen teks ini?Rekognition, Textract, Comprehend
Mengubah formatUbah suara ke teks, teks ke suara, bahasa A ke bahasa B.Transcribe, Polly, Translate
BerinteraksiBuat bot pemesanan, asisten dokumen internal, atau pencarian tanya jawab.Lex, Amazon Q, Kendra
Menganalisis dataQuery data di S3, buat dashboard, olah data besar, streaming log.Athena, Glue, Redshift, QuickSight, Kinesis, EMR, OpenSearch Service
AI/ML Service Picker Mulai dari jenis input, lalu pilih layanan paling langsung Gambar / Video Rekognition Dokumen Textract Teks Comprehend / Translate Audio / Suara Transcribe / Polly Objek, label, wajah Moderasi konten OCR, tabel, form Key-value Sentimen, entitas Terjemahan Audio ke teks Teks ke audio Chatbot intent: Lex Asisten data: Amazon Q / Kendra
Gambar 2. Peta pilihan layanan AI/ML berdasarkan jenis input dan tujuan output.

Di ujian, kata kunci sering lebih penting daripada detail teknis. Kata image, video, objects, atau content moderation mengarah ke Rekognition. Kata forms, tables, scanned document, atau invoice mengarah ke Textract. Kata speech atau audio perlu dibaca hati-hati, apakah ingin menjadi teks atau menjadi suara.

Decision tree: dari satu pertanyaan ke satu layanan

Peta di atas bagus untuk gambaran besar, tetapi saat menghadapi soal kamu butuh alur yang lebih tegas: satu pertanyaan, satu cabang, satu jawaban. Pohon keputusan berikut menyusun pertanyaan paling membedakan lebih dulu (apa jenis input?), lalu menambahkan dua cabang lanjutan yang sering menentukan jawaban: apakah kamu butuh percakapan terstruktur, apakah kamu perlu membangun model sendiri, atau apakah kamu butuh asisten generative AI atas data perusahaan.

Decision Tree: Pilih Layanan AI/ML Mulai dari pertanyaan pertama, ikuti cabang sampai ketemu layanannya Apa jenis INPUT-nya? gambar / dokumen / audio / teks Gambar / video Rekognition Dokumen / form Textract Audio masuk Transcribe Audio keluar Polly Teks masuk Comprehend / Translate Butuh percakapan terstruktur? intent + slot, mis. booking / IVR Amazon Lex tidak? lanjut ke bawah Butuh BUILD model custom? train / tune / deploy + MLOps sendiri SageMaker AI Asisten GenAI atas data perusahaan? Amazon Q
Gambar 3. Pohon keputusan AI/ML: mulai dari jenis input, lalu cabang ke Lex (percakapan), SageMaker AI (model custom), atau Amazon Q (asisten data).
🌳Cara pakai pohon keputusan

Baca soal, jawab pertanyaan paling atas dulu (apa input-nya), baru turun ke cabang berikutnya. Sebagian besar soal CLF-C02 selesai hanya di baris pertama (gambar, dokumen, audio, teks), tanpa perlu turun jauh.

03

Service Picker AI Siap Pakai

Layanan ini cocok saat kamu ingin memakai kemampuan AI tanpa membangun model dari nol.

AI siap pakai itu seperti memanggil spesialis: kamu kirim input, layanan mengembalikan hasil analisis.

Daftar cepat layanan AI/ML

LayananGunakan saatJangan tertukar dengan
Amazon RekognitionMenganalisis gambar dan video, mendeteksi objek, label, wajah, teks di gambar, atau konten tidak pantas.Textract, karena Textract khusus dokumen dan struktur seperti tabel/form.
Amazon TextractMengekstrak teks, handwriting, tabel, form, key-value, invoice, receipt, atau data dari dokumen.Rekognition, karena Rekognition tidak fokus pada struktur dokumen bisnis.
Amazon ComprehendMenganalisis teks, seperti sentimen, entitas, frasa kunci, bahasa dominan, topik, dan PII.Translate, karena Translate mengubah bahasa, bukan memahami makna bisnis teks.
Amazon TranslateMenerjemahkan teks atau dokumen antar bahasa untuk aplikasi multibahasa.Comprehend, karena Comprehend memahami isi teks, bukan menerjemahkan.
Amazon TranscribeMengubah audio atau percakapan menjadi teks.Polly, karena Polly adalah arah sebaliknya.
Amazon PollyMengubah teks menjadi suara yang terdengar natural untuk aplikasi, pembaca artikel, atau IVR.Transcribe, karena Transcribe mengubah suara menjadi teks.
Amazon LexMembangun chatbot atau voice bot berbasis intent, slot, dan alur percakapan.Amazon Q, karena Q adalah asisten generative AI, bukan hanya bot intent tradisional.
Amazon KendraMembangun pencarian cerdas atas dokumen perusahaan dengan pemahaman bahasa natural.OpenSearch Service, karena OpenSearch lebih umum untuk search, log analytics, dan observability.
📝Kata kunci ujian

Soal CLF-C02 sering meminta layanan paling managed dan paling langsung. Bila ada layanan siap pakai yang cocok, pilih itu sebelum memilih SageMaker AI.

Rekognition: kamera pintar

Gunakan Amazon Rekognition ketika inputnya gambar atau video. Contoh nyata: marketplace ingin mendeteksi gambar produk yang melanggar kebijakan, aplikasi event ingin mengenali wajah peserta yang terdaftar, atau sistem keamanan ingin mencari objek tertentu pada video.

⚠️Jebakan Rekognition

Kalau soal menyebut dokumen PDF berisi tabel invoice, itu bukan Rekognition walaupun file itu bisa terlihat sebagai gambar. Kata tabel, form, invoice, receipt, dan key-value mengarah ke Textract.

Textract: petugas input data super cepat

Amazon Textract membantu membaca dokumen seperti manusia admin yang menyalin isi formulir, tetapi dilakukan secara otomatis. Ia cocok untuk proses klaim asuransi, KYC, invoice vendor, medical form, dan dokumen pajak.

Comprehend: pembaca makna teks

Amazon Comprehend cocok untuk membaca teks dan menemukan makna, seperti apakah review pelanggan positif, siapa nama orang atau organisasi yang disebut, bahasa apa yang digunakan, atau apakah teks mengandung informasi pribadi (PII).

🪤Comprehend vs Amazon Macie

Ini distraktor lintas-domain yang sering muncul. Comprehend mendeteksi dan menyamarkan PII pada teks yang kamu kirim ke layanan (mis. isi dokumen atau pesan). Amazon Macie (layanan keamanan) menemukan data sensitif yang sudah tersimpan di bucket Amazon S3. Soal “temukan PII di seluruh bucket S3” mengarah ke Macie, bukan Comprehend. Soal “deteksi atau redaksi PII di dalam teks ini” mengarah ke Comprehend.

Translate, Transcribe, dan Polly: trio pengubah bentuk bahasa

Amazon Translate mengubah bahasa. Amazon Transcribe mengubah suara menjadi teks. Amazon Polly mengubah teks menjadi suara. Ingat arah panahnya karena ini sering menjadi jebakan, dan exam sering membalik arah ini.

Ingat Arah Panahnya Tiga jebakan reversal paling sering di CLF-C02 Transcribe Audio suara / rekaman Teks transkrip ASR: bicara → tulisan Polly Teks artikel / kalimat Audio suara natural TTS: tulisan → bicara Translate Bahasa A EN Bahasa B ID ganti bahasa, bukan makna
Gambar 4. Arah panah trio bahasa: Transcribe audio → teks, Polly teks → audio, Translate bahasa A → bahasa B.
🎙️Analogi studio rekaman

Bayangkan studio podcast. Transcribe adalah juru ketik yang menyalin rekaman menjadi naskah. Polly adalah penyiar yang membaca naskah dengan suara natural. Translate adalah penerjemah yang mengganti bahasa naskah tanpa mengubah ceritanya. Tiga peran berbeda, tiga arah berbeda.

Lex dan Kendra: percakapan dan pencarian

Amazon Lex cocok untuk chatbot yang menanyakan niat pengguna dan mengumpulkan informasi, misalnya booking hotel, cek status pesanan, atau memilih menu IVR. Amazon Kendra cocok ketika pengguna ingin mencari jawaban dari kumpulan dokumen internal, bukan sekadar keyword matching.

Pola cepat AI siap pakai

  • Gambar/video → Rekognition.
  • Dokumen/form/tabel → Textract.
  • Sentimen/entitas/frasa kunci/PII dalam teks → Comprehend.
  • Terjemahan → Translate.
  • Audio ke teks → Transcribe.
  • Teks ke suara → Polly.
  • Chatbot intent dan slot → Lex.
  • Pencarian cerdas dokumen → Kendra.
04

Generative AI dan Amazon Q

Amazon Q membantu pengguna bertanya, merangkum, membuat konten, dan menyelesaikan tugas dengan data perusahaan.

Kalau AI siap pakai seperti alat spesialis, Amazon Q seperti asisten kerja yang bisa diajak bertanya dalam bahasa natural.

Amazon Q adalah keluarga kemampuan generative AI dari AWS. Untuk pemula CLF-C02, bayangkan Amazon Q sebagai asisten yang membantu pengguna menemukan informasi, merangkum dokumen, menjawab pertanyaan, menulis konten, atau membantu pekerjaan developer dan bisnis, bergantung varian dan integrasinya.

🤖Analogi asisten kantor

Kalau Kendra seperti mesin pencari dokumen, Amazon Q seperti rekan kerja yang membaca dokumen yang boleh ia akses, lalu menjawab pertanyaan dengan konteks dan bisa membantu melakukan tugas.

Amazon Q Business

Asisten generative AI untuk data perusahaan, dengan jawaban yang memperhatikan izin akses pengguna dan dapat menyertakan rujukan dari sumber perusahaan. Memakai subscription per user, tanpa free tier permanen.

Amazon Q Developer

Asisten untuk developer dan operator cloud, misalnya membantu memahami AWS, menulis kode, menjelaskan error, atau mempercepat pekerjaan teknis. Punya Free Tier permanen, lalu tier Pro per user.

Amazon Q in QuickSight

Kemampuan natural language di area analytics, misalnya bertanya tentang data dalam bahasa biasa lalu mendapat insight dan ringkasan langsung di dashboard.

Amazon Q bukan sekadar search

Search mengembalikan dokumen. Asisten generative AI dapat merangkum, menjelaskan, menyusun jawaban, dan membantu tindakan sesuai integrasi.

Yang Mana Amazon Q? Satu nama, tiga konteks pemakaian yang berbeda Q Business untuk end users HR, IT, kebijakan, knowledge base permission-aware subscription per user tanpa free tier permanen Q Developer untuk builders code suggestion, jelaskan error, tugas dev punya Free Tier Pro per user / bulan agentic dev tasks Q in QuickSight untuk analis bisnis tanya data pakai bahasa natural (NL BI) buat insight + ringkasan di dalam dashboard add-on di QuickSight
Gambar 5. Tiga konteks Amazon Q: Q Business untuk end users, Q Developer untuk builders (punya Free Tier), dan Q in QuickSight untuk natural language BI.

Which Q? Petunjuk cepat di soal

Petunjuk di soalVarianCue pembeda
Asisten internal untuk karyawan: HR, IT, kebijakan, knowledge base.Q BusinessEnd users, permission-aware, subscription per user, tanpa free tier.
Bantu developer menulis kode, menjelaskan error, atau tugas dev di IDE/CLI.Q DeveloperBuilders, ada Free Tier permanen, tugas coding dan cloud.
Analis bertanya ke data pakai bahasa natural di dashboard.Q in QuickSightNatural language BI, ringkasan dan insight di QuickSight.
Amazon Q Business · untuk end users
  • Pengguna sasaran: karyawan non-teknis yang bertanya tentang data perusahaan.
  • Jawaban permission-aware, menghormati izin akses tiap pengguna.
  • Pemakaian umum: HR, IT help desk, kebijakan, onboarding, knowledge base.
  • Model harga: subscription per user (Lite atau Pro), tanpa free tier permanen.
Amazon Q Developer · untuk builders
  • Pengguna sasaran: developer dan operator cloud di IDE, CLI, atau console.
  • Membantu menulis kode, menjelaskan error, dan menjalankan tugas dev agentic.
  • Pemakaian umum: percepat coding, pahami AWS, transformasi/upgrade kode.
  • Model harga: ada Free Tier permanen, lalu tier Pro per user.

Kapan pilih Amazon Q?

  • Ketika user ingin bertanya dalam bahasa natural kepada data atau dokumen perusahaan.

  • Ketika organisasi ingin asisten internal untuk HR, IT help desk, kebijakan perusahaan, knowledge base, atau produktivitas kerja.

  • Ketika kebutuhan bukan sekadar menemukan file, tetapi merangkum dan menjawab berdasarkan konteks.

  • Ketika jawaban harus mempertimbangkan izin akses pengguna, bukan semua orang melihat semua data.

Amazon Q vs Kendra vs Lex

KebutuhanPilihKenapa
Pengguna ingin mencari jawaban dari dokumen dengan pencarian semantik.KendraFokus pada intelligent search dan retrieval dokumen.
Pengguna ingin asisten generative AI yang menjawab, merangkum, dan membantu tugas berbasis data perusahaan.Amazon QFokus pada asisten generative AI yang terhubung ke enterprise data.
Pengguna ingin bot percakapan terstruktur untuk memesan, memilih menu, atau mengisi slot informasi.LexFokus pada intent, slot, dan alur percakapan.
🎯Tips ujian

Kalau soal menyebut generative AI assistant untuk data perusahaan, pikirkan Amazon Q. Kalau soal menyebut intelligent search atas dokumen, pikirkan Kendra. Kalau soal menyebut chatbot dengan intent dan slot, pikirkan Lex.

Tangga: search, intelligent search, lalu asisten

Ketiganya terlihat mirip karena sama-sama berurusan dengan dokumen, tetapi mereka berada di tangga yang berbeda. OpenSearch Service kuat untuk pencarian berbasis indeks dan analisis log. Kendra naik satu tingkat dengan pencarian cerdas yang memahami pertanyaan bahasa natural dan mengembalikan jawaban atau passage relevan. Amazon Q naik lagi: ia tidak hanya menemukan, tetapi merangkum, menjelaskan, dan menyusun jawaban. Menariknya, sejak Kendra punya GenAI Index, Kendra bisa menjadi retriever yang memberi bahan kepada Amazon Q.

Tangga: Cari → Pahami → Jawab Makin ke kanan, makin banyak pemahaman dan kemampuan menghasilkan jawaban keyword / indeks jawaban + tindakan OpenSearch Service full-text search, log analytics, observability Amazon Kendra intelligent search, semantik / tanya jawab, retriever dokumen Amazon Q asisten generative AI, merangkum, menjawab, permission-aware Kendra GenAI Index dapat menjadi retriever untuk Amazon Q
Gambar 6. Tangga pemahaman: OpenSearch Service (cari) → Kendra (cari cerdas) → Amazon Q (jawab generative), dengan Kendra GenAI Index dapat menyuapi Amazon Q.

Di mana posisi Amazon Bedrock?

Amazon Bedrock adalah layanan untuk membangun aplikasi generative AI di atas foundation model (memilih model, menambah knowledge base, membuat agent). Ia kuat dan penting di dunia nyata, tetapi tidak termasuk daftar in-scope Machine Learning CLF-C02. Untuk ujian ini, fokus generative AI ada pada Amazon Q (asisten siap pakai) dan SageMaker AI (platform model). Bedrock yang mendalam adalah materi ujian AIF-C01 dan AIP-C01, bukan CLF-C02. Jadi bila Bedrock muncul sebagai pilihan jawaban di soal bergaya CLF-C02, ia biasanya distraktor.

05

SageMaker AI untuk Platform ML

Pilih SageMaker AI ketika tim perlu membangun, melatih, dan menjalankan model ML sendiri.

SageMaker AI adalah dapur profesional untuk data scientist, bukan sekadar blender otomatis untuk satu tugas.

Amazon SageMaker AI adalah layanan fully managed untuk membangun, melatih, dan men-deploy model machine learning dan foundation model ke environment produksi yang dikelola AWS.

🏷️Nuansa nama (3 Desember 2024)

Pada 3 Desember 2024 AWS mengganti nama Amazon SageMaker menjadi Amazon SageMaker AI (rename ini tidak mengubah API, CLI, atau endpoint lama, jadi tetap kompatibel). Di hari yang sama AWS juga merilis “next generation of Amazon SageMaker”, yaitu platform terpadu untuk data, analytics, dan AI (mencakup SageMaker Unified Studio, Lakehouse, Catalog, dan Bedrock). Untuk ujian: soal tentang membangun, melatih, atau men-deploy model menjawab SageMaker AI (layanan model), bukan SageMaker Unified Studio (platform terpadu).

🍳Analogi dapur profesional

Kalau Rekognition, Textract, dan Polly adalah makanan siap saji untuk kebutuhan spesifik, SageMaker AI adalah dapur lengkap untuk membuat resep model sendiri dari bahan data yang kamu punya.

Build

Data scientist dapat menyiapkan notebook, data, eksperimen, dan kode ML.

Train

Model dilatih memakai data dan compute yang sesuai, tanpa harus merakit server sendiri dari nol.

Deploy

Model dapat dijalankan sebagai endpoint atau alur produksi agar aplikasi bisa meminta prediksi.

Kapan SageMaker AI paling masuk akal?

  • Perusahaan punya data unik dan ingin model yang disesuaikan, misalnya fraud detection khusus pola transaksi internal.

  • Tim perlu kontrol lebih besar atas pelatihan, eksperimen, model, deployment, dan MLOps.

  • Layanan AI siap pakai tidak cukup karena domainnya spesifik, misalnya prediksi risiko berdasarkan data industri tertentu.

  • Organisasi punya data scientist atau ML engineer yang memang akan mengelola siklus hidup model.

Kapan jangan pilih SageMaker AI?

Use caseJawaban yang lebih langsungAlasan
Mendeteksi objek dalam gambar produk.RekognitionModel computer vision siap pakai sudah cukup.
Mengambil data dari invoice PDF.TextractFokus pada dokumen, tabel, form, dan key-value.
Menerjemahkan review pelanggan.TranslateTugasnya translation, bukan custom ML.
Mengubah rekaman call center menjadi teks.TranscribeTugasnya automatic speech recognition.
Membuat bot pemesanan sederhana.LexIntent dan slot lebih sesuai daripada membangun model sendiri.
🧠Cara menjawab soal

Pilih SageMaker AI jika soal menekankan membangun, melatih, tuning, deployment model sendiri, atau kebutuhan custom ML. Pilih layanan AI siap pakai jika soal menggambarkan tugas umum yang sudah disediakan AWS.

06

Analytics Picker: Kapan Pakai Apa?

Analytics dipakai ketika masalahnya bukan hanya AI, tetapi mengolah dan memahami data dalam skala bisnis.

Kalau AI menjawab pertanyaan spesifik, analytics membantu melihat pola besar dari data yang terus bertambah.

Dalam CLF-C02, layanan analytics yang perlu dikenal tepat 7: Amazon Athena, Amazon EMR, AWS Glue, Amazon Kinesis, Amazon OpenSearch Service, Amazon QuickSight, dan Amazon Redshift. Fokusnya adalah memahami kapan memilih masing-masing, bukan menghafal konfigurasi cluster.

Layanan analyticsGunakan saatAnalogi cepat
Amazon AthenaIngin menjalankan query SQL langsung ke data di Amazon S3 tanpa menyiapkan server database.Meja tanya jawab cepat untuk data lake.
AWS GlueIngin menemukan, mengatalogkan, membersihkan, mengubah, dan memindahkan data untuk analytics atau ML.Petugas ETL dan katalog perpustakaan data.
Amazon RedshiftButuh data warehouse terkelola untuk analisis data besar, dashboard, dan query bisnis yang berat.Gudang data analitik perusahaan.
Amazon QuickSightIngin membuat dashboard, visualisasi, laporan, dan BI untuk pengguna bisnis.Panel indikator bisnis.
Amazon KinesisIngin mengumpulkan dan memproses data streaming hampir real-time, seperti clickstream, IoT, atau log aplikasi.Sungai data yang terus mengalir.
Amazon OpenSearch ServiceButuh search, log analytics, observability, atau analisis data berbasis indeks.Mesin pencari dan kaca pembesar log.
Amazon EMRButuh pemrosesan big data memakai framework seperti Apache Spark atau Hadoop.Pabrik pemrosesan data skala besar.
📊Urutan pikir analytics

Data mentah di S3 bisa dikatalogkan oleh Glue, ditanya dengan Athena, diolah besar dengan EMR, dimasukkan ke Redshift untuk data warehouse, lalu divisualisasikan dengan QuickSight.

Pipeline Analytics: dari Data Mentah ke Dashboard Jalur streaming (oranye), jalur batch (biru), dan jalur search (teal) Kinesis Data Streams ingest real-time Amazon Data Firehose deliver ke tujuan Amazon S3 data lake (raw) AWS Glue katalog + ETL Athena SQL ad hoc di S3 Amazon EMR Spark / Hadoop Amazon Redshift data warehouse QuickSight dashboard / BI OpenSearch Service search / log analytics
Gambar 7. Pipeline analytics: jalur streaming (Kinesis · Data Firehose), jalur batch (S3 · Glue · Athena/EMR/Redshift · QuickSight), dan jalur search (OpenSearch Service).

Kinesis dan Amazon Data Firehose

”Amazon Kinesis” adalah payung in-scope CLF-C02 untuk data streaming. Di bawahnya ada dua hal yang berguna kamu bedakan: Kinesis Data Streams untuk menangkap dan memproses data secara real-time, dan Amazon Data Firehose untuk mengirim (deliver) stream itu ke tujuan seperti S3, Redshift, atau OpenSearch Service. Catatan nama: sejak 9 Februari 2024, “Kinesis Data Firehose” berganti nama menjadi Amazon Data Firehose (hanya nama yang berubah). Pakai nama baru ini di materi 2026.

Athena vs Redshift: pasangan yang sering tertukar

Keduanya menjalankan SQL untuk analitik, tetapi modelnya berbeda. Athena serverless dan bayar per query langsung di atas data S3, ideal untuk pertanyaan ad hoc yang tidak rutin. Redshift adalah data warehouse terkelola yang kamu provisioning untuk beban BI berat dan berulang dalam skala besar.

Amazon Athena · serverless ad hoc
  • Serverless, tanpa cluster yang perlu dikelola.
  • SQL langsung di atas data S3, tidak perlu memindahkan data dulu.
  • Model biaya: bayar per query (per data yang dipindai).
  • Cocok untuk analisis ad hoc, sesekali, atau eksplorasi cepat.
Amazon Redshift · data warehouse
  • Data warehouse terkelola yang di-provisioning.
  • Data dimuat ke dalam warehouse untuk performa kueri yang konsisten.
  • Model biaya: kapasitas warehouse yang berjalan.
  • Cocok untuk BI berat, berulang, dan analitik skala besar.
🎯Cue Athena vs Redshift

Soal yang menyebut serverless, ad hoc, pay-per-query, atau SQL langsung di S3 mengarah ke Athena. Soal yang menyebut data warehouse, BI workload berat, atau analitik skala besar yang berulang mengarah ke Redshift.

Service picker analytics paling sering

Query ad hoc data di S3

Pilih Athena. Kata kunci: SQL, S3, serverless query, ad hoc analysis.

ETL dan katalog data

Pilih Glue. Kata kunci: crawl, catalog, transform, prepare, ETL.

Data warehouse

Pilih Redshift. Kata kunci: petabyte-scale warehouse, BI workload, analytical queries.

Dashboard bisnis

Pilih QuickSight. Kata kunci: visualization, dashboard, BI, reports.

Streaming data

Pilih Kinesis. Kata kunci: real-time stream, clickstream, logs, telemetry.

Search dan log analytics

Pilih OpenSearch Service. Kata kunci: indexing, full-text search, log search, observability.

07

Cara Kerja End-to-End

Banyak solusi nyata menggabungkan AI/ML dan analytics dalam satu alur.

Di dunia nyata, satu layanan jarang bekerja sendirian. Dokumen, audio, gambar, dan log biasanya masuk ke storage, diproses, lalu dianalisis.

Alur AI/ML dan Analytics Data masuk, dipahami oleh AI, diolah analytics, lalu menjadi keputusan Input Dokumen, audio gambar, teks, log AI services Textract, Rekognition Comprehend, Transcribe Translate, Polly, Lex Data lake Amazon S3 Glue Catalog Analytics Athena, Redshift QuickSight, Kinesis OpenSearch, EMR Dashboard, laporan, insight, atau asisten Amazon Q Custom ML bila perlu: SageMaker AI
Gambar 8. Contoh alur end-to-end: data masuk, AI mengekstrak makna, analytics mengolah pola, dashboard atau asisten membantu keputusan.

Contoh alur klaim asuransi

Dokumen masuk ke S3

Nasabah mengunggah foto formulir klaim, kuitansi, dan rekaman percakapan layanan pelanggan.

Textract membaca dokumen

Textract mengekstrak teks, tabel, dan key-value dari formulir atau kuitansi.

Comprehend memahami teks

Comprehend mendeteksi entitas, frasa penting, sentimen, atau data pribadi yang perlu dilindungi.

Transcribe memproses audio

Rekaman call center diubah menjadi teks agar bisa dicari dan dianalisis.

Glue menyiapkan data

Glue mengatalogkan dan membersihkan data agar siap dianalisis.

Athena atau Redshift menganalisis

Athena cocok untuk query langsung di S3, Redshift cocok untuk data warehouse dan analisis bisnis berat.

QuickSight menampilkan dashboard

Manajer melihat tren klaim, waktu proses, biaya, dan area risiko.

🔐Keamanan tetap penting

AI/ML tidak menghapus tanggung jawab keamanan. Perhatikan IAM, enkripsi, logging, data sensitif, izin akses, dan kepatuhan ketika memproses dokumen, audio, gambar, atau data pelanggan.

Polanya sederhana

Masukan → ekstraksi atau pemahaman → penyimpanan → transformasi → query → visualisasi atau asisten. Kalau kamu bisa membaca alur ini, soal service picker akan terasa jauh lebih mudah.

08

Skenario Nyata dan Pilihan Layanan

Latih diri dengan membaca kebutuhan bisnis, lalu pilih layanan paling langsung.

Bagian ini adalah latihan membaca soal. Fokus pada kata kunci, bukan pada nama layanan yang terdengar paling canggih.

Skenario 1: Marketplace skincare ingin moderasi gambar produk

Tim marketplace ingin mendeteksi gambar tidak pantas, gambar produk palsu, dan objek tertentu pada foto listing. Pilihan paling tepat adalah Amazon Rekognition, karena inputnya gambar dan tujuannya computer vision.

Skenario 2: Finance ingin mengambil data dari invoice vendor

Invoice berisi nomor invoice, tanggal, total, tabel item, dan data vendor. Pilihan paling tepat adalah Amazon Textract, karena fokusnya ekstraksi dokumen, form, tabel, dan key-value.

Skenario 3: Customer support ingin tahu sentimen review

Review produk dalam bentuk teks perlu diberi label positif, negatif, netral, atau mixed. Pilihan paling tepat adalah Amazon Comprehend, karena fokusnya natural language processing dan sentiment analysis.

Skenario 4: Call center ingin membuat transkrip percakapan

Rekaman audio pelanggan perlu diubah menjadi teks. Pilihan paling tepat adalah Amazon Transcribe. Setelah menjadi teks, kamu bisa memakai Comprehend untuk memahami sentimen atau entitas.

Skenario 5: Aplikasi belajar ingin membacakan artikel

Artikel teks ingin diubah menjadi suara agar lebih aksesibel. Pilihan paling tepat adalah Amazon Polly, karena output yang diinginkan adalah speech.

Skenario 6: Perusahaan ingin chatbot untuk booking jadwal

Bot perlu bertanya tanggal, jam, lokasi, dan tujuan meeting. Pilihan paling tepat adalah Amazon Lex, karena ada intent dan slot yang jelas.

Skenario 7: Karyawan ingin bertanya ke dokumen internal

Jika kebutuhannya pencarian cerdas atas dokumen, pilih Amazon Kendra. Jika kebutuhannya asisten generative AI yang menjawab, merangkum, dan membantu tugas berbasis data perusahaan, pilih Amazon Q.

Skenario 8: Data analyst ingin query log di S3

Log aplikasi sudah tersimpan di Amazon S3 dan analyst ingin menjalankan SQL ad hoc. Pilihan paling tepat adalah Amazon Athena, sering dibantu AWS Glue Data Catalog untuk metadata.

Skenario 9: Manajemen ingin dashboard penjualan

Data sudah siap dianalisis dan pengguna bisnis ingin dashboard interaktif. Pilihan paling tepat adalah Amazon QuickSight. Jika datanya besar dan kompleks sebagai warehouse, Amazon Redshift dapat menjadi sumber analitiknya.

Latihan mental

Setiap skenario punya kata benda penting: gambar, dokumen, audio, teks, chatbot, pencarian, dashboard, streaming, warehouse. Kata benda itu biasanya mengarahkan jawaban.

09

Hands-on Ringan dan Walkthrough Konseptual

Tujuannya membangun intuisi, bukan membuat proyek produksi.

Hands-on terbaik untuk pemula adalah mencoba beberapa layanan melalui console dengan input kecil dan memahami outputnya.

💸Catatan biaya

Sebelum mencoba layanan apa pun, selalu cek halaman pricing resmi, region yang dipakai, dan hapus resource atau data uji setelah selesai. Jangan menghafal angka harga untuk ujian kecuali diminta sumber resmi terbaru.

🧾Kesadaran model biaya (Domain 4)

Kamu tidak perlu hafal angka, tetapi kenali polanya. Layanan AI menagih per satuan pemakaian: per karakter teks (Comprehend, Translate, Polly), per menit audio (Transcribe), per halaman dokumen (Textract), atau per gambar/menit video (Rekognition). Untuk asisten: Amazon Q Developer punya Free Tier permanen, sedangkan Amazon Q Business tidak punya free tier dan ditagih subscription per user. Pola ini cukup untuk soal billing CLF-C02.

Walkthrough 1: Bedakan Rekognition dan Textract

Siapkan dua contoh input

Satu foto produk, satu gambar invoice atau formulir sederhana.

Bayangkan foto produk masuk ke Rekognition

Output yang dicari adalah label objek, scene, atau moderasi konten.

Bayangkan invoice masuk ke Textract

Output yang dicari adalah teks, tabel, field, dan pasangan key-value.

Tulis perbedaan dalam satu kalimat

Rekognition memahami visual umum, Textract memahami struktur dokumen.

Walkthrough 2: Rangkai bahasa pelanggan

Mulai dari review pelanggan

Review berbahasa asing masuk sebagai teks mentah.

Gunakan Translate

Terjemahkan teks ke bahasa kerja tim support.

Gunakan Comprehend

Deteksi sentimen, entitas, frasa kunci, atau PII dari teks.

Gunakan Polly bila perlu

Ubah ringkasan teks menjadi audio untuk fitur aksesibilitas atau notifikasi suara.

Walkthrough 3: Bangun alur analytics sederhana

Data mentah di S3

Anggap file CSV penjualan disimpan di bucket S3.

Glue membuat metadata

Crawler Glue menemukan skema dan menyimpan definisi tabel di Data Catalog.

Athena menjalankan SQL

Analyst menanyakan total penjualan per kategori tanpa membuat database server.

QuickSight membuat dashboard

Hasil analisis divisualisasikan agar mudah dipahami manajemen.

Checklist observasi

  • Apa input utamanya: teks, audio, gambar, dokumen, atau data tabular?

  • Apa output yang diinginkan: label, transkrip, terjemahan, suara, sentimen, dashboard, atau prediksi?

  • Apakah cukup memakai AI siap pakai, atau perlu membangun model sendiri?

  • Apakah data sensitif perlu enkripsi, kontrol akses, audit, atau masking?

  • Apakah workload hanya batch, streaming, pencarian, dashboard, atau data warehouse?

10

Kesalahan Umum dan Jebakan Soal

Mayoritas kesalahan pemula berasal dari memilih layanan yang terlalu besar atau salah arah input-output.

Jebakan utama: semua yang berbau AI dijawab SageMaker AI. Padahal CLF-C02 lebih sering menguji pemilihan layanan siap pakai.

Kesalahan umum pemula

Memilih SageMaker AI untuk semua AI

Gunakan SageMaker AI untuk custom ML. Untuk tugas umum, pilih layanan siap pakai yang lebih langsung.

Tertukar Transcribe dan Polly

Transcribe adalah audio ke teks. Polly adalah teks ke audio.

Tertukar Rekognition dan Textract

Rekognition untuk gambar/video umum. Textract untuk dokumen, form, tabel, dan key-value.

Tertukar Comprehend dan Translate

Comprehend memahami teks. Translate menerjemahkan teks.

Tertukar Lex dan Amazon Q

Lex untuk bot intent/slot. Amazon Q untuk asisten generative AI berbasis konteks dan data.

Tertukar Athena dan Redshift

Athena query langsung data di S3. Redshift adalah data warehouse terkelola untuk analitik skala besar.

Tertukar Comprehend dan Macie

Comprehend deteksi/redaksi PII dalam teks yang kamu kirim. Macie temukan data sensitif yang tersimpan di S3.

Memilih Bedrock di soal CLF-C02

Bedrock bukan in-scope CLF-C02. Untuk generative AI, jawaban yang dimaksud biasanya Amazon Q atau SageMaker AI.

Tertukar Kendra dan OpenSearch

Kendra intelligent search untuk tanya jawab dokumen. OpenSearch full-text search, log analytics, dan observability.

Jebakan pilihan jawaban

Kata di soalJawaban cenderung benarDistractor yang sering menggoda
Detect unsafe images, labels, faces, objectsRekognitionSageMaker AI
Extract tables from scanned formsTextractRekognition
Customer sentiment from textComprehendTranslate
Translate content to another languageTranslateComprehend
Convert call recording to textTranscribePolly
Convert article text to spoken audioPollyTranscribe
Chatbot with intents and slotsLexAmazon Q
Enterprise assistant that answers from company dataAmazon QLex
SQL query on S3 dataAthenaRedshift
Business dashboard and BIQuickSightGlue
Discover PII across S3 bucketsMacieComprehend
Detect or redact PII inside this textComprehendMacie
Intelligent search Q&A over documentsKendraOpenSearch Service
Build/train/deploy a custom ML modelSageMaker AIRekognition
Build GenAI app on foundation modelsBedrock (bukan in-scope)Amazon Q
🎯Strategi eliminasi

Eliminasi jawaban yang terlalu teknis bila soal meminta solusi managed dan siap pakai. Untuk CLF-C02, layanan yang paling sederhana dan tepat guna sering menjadi jawaban terbaik.

Jebakan keamanan dan biaya

  • AI/ML tetap membutuhkan IAM permission yang benar. Jangan memberi akses data lebih luas dari kebutuhan.

  • Dokumen, audio, dan gambar pelanggan bisa berisi data sensitif. Pertimbangkan enkripsi, logging, data retention, dan masking.

  • Beberapa layanan menagih berdasarkan karakter, durasi audio, halaman dokumen, request, compute, storage, indeks, atau user subscription. Untuk praktik, selalu cek pricing resmi.

  • Region dan ketersediaan fitur bisa berbeda. Jangan mengklaim semua fitur tersedia di semua region tanpa verifikasi.

11

Ringkasan & Tips Ujian

Pegang pola input-output, lalu petakan ke domain CLF-C02.

Untuk lulus bagian AI/ML dan analytics di CLF-C02, kamu tidak perlu menjadi data scientist. Kamu perlu menjadi pemilih alat yang rapi.

Poin Penting

  • Rekognition untuk gambar dan video.
  • Textract untuk OCR dokumen, form, tabel, dan key-value.
  • Comprehend untuk memahami teks, seperti sentimen, entitas, frasa kunci, bahasa, dan PII (ingat Macie untuk PII di S3).
  • Translate untuk menerjemahkan teks antar bahasa.
  • Transcribe untuk audio menjadi teks, Polly untuk teks menjadi suara (ingat arah panahnya).
  • Lex untuk chatbot berbasis intent dan slot.
  • Kendra untuk pencarian cerdas dokumen, beda dari OpenSearch Service yang untuk full-text search dan log analytics.
  • Amazon Q untuk asisten generative AI: Q Business (end users, permission-aware), Q Developer (builders, ada Free Tier), Q in QuickSight (natural language BI).
  • SageMaker AI untuk membangun, melatih, dan menjalankan model ML custom (nama baru sejak Des 2024 untuk Amazon SageMaker).
  • Athena, EMR, Glue, Kinesis, OpenSearch Service, QuickSight, dan Redshift adalah 7 layanan analytics in-scope; pilih berdasarkan pola data dan tujuan analisis.
  • Bedrock, Personalize, Forecast, Fraud Detector, Lake Formation, dan MSK bukan in-scope CLF-C02, cukup dikenali sekilas.

Pemetaan ke domain CLF-C02

DomainBobotKaitan dengan modul ini
Domain 1: Cloud Concepts24%AI siap pakai menunjukkan value cloud: tidak perlu membangun model dan infrastruktur dari nol.
Domain 2: Security and Compliance30%Data AI/ML bisa sensitif. Pahami IAM, enkripsi, audit, privacy, dan shared responsibility saat memproses data pelanggan.
Domain 3: Cloud Technology and Services34%Ini domain paling relevan untuk service picker AI/ML dan analytics. Hafalkan use case, bukan detail implementasi.
Domain 4: Billing, Pricing, and Support12%Pahami bahwa model biaya berbeda per layanan, seperti request, karakter, durasi, halaman, compute, storage, indeks, atau pengguna.

Rumus cepat 30 detik

Baca input

Apakah inputnya gambar, video, dokumen, audio, teks, data stream, data S3, atau data warehouse?

Baca output

Apakah ingin label, teks, suara, terjemahan, sentimen, pencarian, jawaban generative AI, dashboard, atau prediksi?

Pilih layanan paling langsung

Jangan memilih SageMaker AI bila layanan siap pakai sudah menyelesaikan masalah.

Cek konteks keamanan dan biaya

Perhatikan data sensitif, izin akses, region, logging, dan model penagihan.

🏁Tips terakhir

Di CLF-C02, jawaban terbaik biasanya bukan yang paling canggih, tetapi yang paling sesuai dengan kata kunci use case, paling managed, dan paling sederhana untuk kebutuhan bisnis.