Live Code ini dikerjakan dalam format notebook dan push file notebook pekerjaannya ke repository soal. Beri nama file dengan: h8_p0lc3_NAMA.ipynb
Kamu adalah seorang data analis di Austin Smart City. Saat ini, kamu sedang membantu kepolisian kota Austin untuk mempelajari kondisi tindak kejahatan di kota Austin.
Dataset yang akan digunakan dapat diakses menggunakan bigquery-public-data
pada Google Cloud Big Query.
Buka Google Cloud Platform, masuk ke BigQuery, lalu buka tab bigquery-public-data
atau klik link berikut atau link berikut untuk langsung menuju ke tabel.
PERHATIKAN!
- Data yang digunakan adalah tabel
crime
pada datasetaustin_crime
. - Setiap jawaban, wajib menyertakan query yang dikerjakan pada BigQuery ke dalam notebook di tiap nomor penjabaran masalahnya
- Simpan setiap hasil Query ke dalam file .csv dengan format nama file:
P0LC3_Nama_Nomor Soal.csv
contoh:P0LC3_Fahmi_1.csv
. - Load data menggunakan Pandas untuk setiap soal.
Supaya analisismu terarah, kita perlu membuat penjabaran masalah dan kemudian dapat disimpulkan. Namun, sebelum membuat penjabaran masalah, pastikan sudah menentukan problem statement agar kesimpulan yang dibuat lebih terarah.
- Definisikan problem statement berdasarkan penjabaran masalah di bawah yang akan teman-teman jawab menggunakan SQL!
- Tampilkan tabel crime sampai 5 baris pertama
- Apa saja jenis tindak kejahatan yang terjadi di kota Austin selama tahun 2016?
- Berapa banyak kasus tindak kejahatan berdasarkan kasus pembersihannya (clearance status) selama tahun 2016?
- Jenis kejahatan apa saja yang paling banyak belum terselesaikan kasusnya di tahun 2016?
- Di bulan apa di tahun 2016 kasus pencurian (theft) sangat banyak terjadi?
- Di distrik apa yang paling banyak terjadi kasus pencurian selama 2016?
- Berapa lama rata-rata waktu (dalam hari) kasus tindak kejahatan 'theft' terselesaikan sejak kasus tersebut terangkat selama tahun 2016? (
Hint: Hitung selisih hari dari timestamp hingga clearance date
)
PERHATIKAN: untuk nomor 2-6, tiap nomor diharuskan ada insight yang disampaikan. Tidak perlu membuat plot/data visualisasi. Hanya tampilkan berupa dataframe (langsung hasil dari query)!
- Dari penjabaran yang sudah kamu bahas (pertanyaan 2-7), apa kesimpulan yang kamu dapat sampaikan?
Impementasi Code Python
No. | Criteria | Meet Expectations | Points |
---|---|---|---|
a | SQL Queries | Mampu mengolah data sampai siap dianalisa meliputi data cleaning dan missing value checking/handling | 5 pts each (35 pts max) |
Menjawab Pertanyaan
No. | Criteria | Meet Expectations | Points |
---|---|---|---|
a | Problem Statement | Mampu mendefinisikan problem statement | 4 pts |
b | Insights | Mampu memberikan kesimpulan/insight dari masing-masing penjabaran (poin penjabaran 2-7) | 6 pts each (36 pts max) |
c | Overall Analysis | Mampu memberikan kesimpulan/insight dari penjabaran dan problem statement pada poin analisis | 15 pts |
Criteria | Meet Expectations | Points |
---|---|---|
Tertata Dengan Baik | Semua Cell Di Notebook Terdokumentasi Dengan Baik Dengan Markdown Pada Tiap Cell Untuk Penjelasan Kode dan Format Notebook Sesuai dengan Template. | 10 pts |
**100**