Kembali ke E-Learning

DATA SCIENCE

Pertemuan 12

Fauzi, S.Kom., M.Eng

Mata Kuliah: Pengantar Teknik Informatika
Program Studi Teknik Informatika
1

Capaian Pembelajaran

Pemahaman

  • • Memahami definisi dan konsep Data Science
  • • Menjelaskan lifecycle Data Science
  • • Membedakan Data Science, Analytics, dan Mining

Aplikasi

  • • Mengenal tools dan teknologi Data Science
  • • Memahami konsep Big Data (5V)
  • • Mengidentifikasi aplikasi Data Science
2

Definisi Data Science

Menurut Para Ahli:

"Data Science adalah bidang interdisipliner yang menggunakan metode, proses, algoritma, dan sistem ilmiah untuk mengekstrak pengetahuan dari data terstruktur dan tidak terstruktur."

- IBM

"Data Science menggabungkan statistik, analisis data, machine learning, dan metode terkait untuk memahami dan menganalisis fenomena aktual dengan data."

- Wikipedia
Data Science Applications
3

Karakteristik Data Science

Interdisipliner

Menggabungkan matematika, statistik, ilmu komputer, dan domain expertise

Data-Driven

Keputusan dan insight berdasarkan analisis data empiris

Otomatisasi

Menggunakan algoritma dan machine learning untuk automasi

Insight-Oriented

Fokus pada penemuan pola dan insight dari data

Scalable

Dapat menangani data dalam volume besar (Big Data)

Prediktif

Kemampuan untuk memprediksi tren dan perilaku masa depan

4

Data Science Lifecycle

Data Science Lifecycle

1. Business Understanding

Memahami tujuan bisnis dan mendefinisikan masalah yang akan dipecahkan

2. Data Understanding

Mengumpulkan data dan memahami karakteristik data yang tersedia

3. Data Preparation

Membersihkan, mengintegrasikan, dan memformat data untuk analisis

4. Modeling

Membangun dan melatih model machine learning atau statistik

5. Evaluation

Mengevaluasi performa model dan validasi hasil

6. Deployment

Implementasi model ke production environment

5

Perbandingan: Data Science vs Data Analytics vs Data Mining

Data Science vs Analytics vs Mining

Data Science

  • Tujuan: Ekstrak insight dan prediksi dari data
  • Scope: End-to-end (business understanding → deployment)
  • Metode: Machine Learning, AI, Statistik
  • Output: Model prediktif, automated systems

Data Analytics

  • Tujuan: Analisis data untuk decision making
  • Scope: Analisis data historis dan real-time
  • Metode: Statistik deskriptif, visualisasi
  • Output: Reports, dashboards, insights

Data Mining

  • Tujuan: Menemukan pola tersembunyi dalam data
  • Scope: Ekstraksi pattern dari dataset besar
  • Metode: Clustering, association rules, classification
  • Output: Patterns, rules, anomalies
6

Tools dan Teknologi Data Science

Programming Languages

Database & Query

Data Science Tools

Popular Data Science Tools

Jupyter Notebook

Interactive development environment

Pandas

Data manipulation library

Scikit-learn

Machine learning library

TensorFlow

Deep learning framework

7

Big Data: Konsep 5V

5V of Big Data

Volume

Jumlah data yang sangat besar (terabytes hingga petabytes)

Velocity

Kecepatan data dihasilkan dan diproses secara real-time

Variety

Beragam jenis data (structured, semi-structured, unstructured)

Veracity

Kualitas dan akurasi data yang dapat dipercaya

Value

Nilai bisnis yang dapat diekstrak dari data

8

Data Visualization

Definisi

Data Visualization adalah representasi grafis dari informasi dan data menggunakan elemen visual seperti chart, graph, dan map untuk memudahkan pemahaman pola, tren, dan insight.

Tujuan:

  • • Memudahkan interpretasi data
  • • Mengidentifikasi pola dan tren
  • • Mengkomunikasikan insight
  • • Mendukung decision making
Types of Charts and Graphs

Jenis-jenis Visualisasi Data

Bar Chart

Perbandingan kategori

Line Chart

Tren over time

Pie Chart

Proporsi data

Scatter Plot

Korelasi variabel

9

Aplikasi Data Science

Healthcare

  • • Diagnosis penyakit berbasis AI
  • • Drug discovery dan development
  • • Personalized medicine
  • • Medical image analysis

Finance

  • • Fraud detection
  • • Credit scoring
  • • Algorithmic trading
  • • Risk management

E-commerce

  • • Recommendation systems
  • • Price optimization
  • • Customer segmentation
  • • Demand forecasting

Transportation

  • • Autonomous vehicles
  • • Route optimization
  • • Traffic management
  • • Predictive maintenance

Entertainment

  • • Content recommendation
  • • Audience analytics
  • • Content creation AI
  • • Personalized experiences

Manufacturing

  • • Quality control
  • • Predictive maintenance
  • • Supply chain optimization
  • • Process automation
10

Peran Data Scientist

Definisi

Data Scientist adalah profesional yang menggunakan scientific methods, processes, algorithms, dan systems untuk mengekstrak pengetahuan dan insights dari data strukturured dan unstructured.

Skills yang Dibutuhkan

Technical Skills:

Programming (Python/R), Statistics, Machine Learning, SQL, Data Visualization

Business Skills:

Domain knowledge, Problem solving, Communication, Project management

Tanggung Jawab

Data Collection & Analysis

Mengumpulkan, membersihkan, dan menganalisis data

Model Development

Membangun dan melatih model machine learning

Data Visualization

Membuat visualisasi dan dashboard untuk stakeholders

Insight Generation

Menginterpretasi hasil dan memberikan rekomendasi bisnis

Model Deployment

Implementasi model ke production environment

11

Tren dan Masa Depan Data Science

AutoML

Automated Machine Learning yang memungkinkan non-experts untuk membangun model ML dengan mudah

Explainable AI

AI yang dapat menjelaskan proses decision making dan reasoning-nya kepada manusia

Quantum Computing

Quantum computing untuk memproses data dalam skala yang sangat besar dengan kecepatan tinggi

Edge Analytics

Analisis data langsung di device edge (IoT, mobile) tanpa perlu transfer ke cloud

Privacy-Preserving ML

Teknik machine learning yang menjaga privacy data seperti Federated Learning dan Differential Privacy

Conversational AI

AI yang dapat berinteraksi dengan manusia menggunakan natural language processing

12

Tantangan dalam Data Science

Data Quality Issues

  • • Missing values dan incomplete data
  • • Inconsistent data formats
  • • Outliers dan anomalies
  • • Data bias dan sampling issues

Privacy & Security

  • • Data privacy regulations (GDPR)
  • • Sensitive data protection
  • • Cybersecurity threats
  • • Ethical use of data

Skills Gap

  • • Shortage of qualified data scientists
  • • Need for continuous learning
  • • Technical vs business skills balance
  • • Cross-functional collaboration

Scalability

  • • Big data processing challenges
  • • Infrastructure costs
  • • Model deployment at scale
  • • Real-time processing requirements
13

Kesimpulan

Key Takeaways

  • • Data Science adalah bidang interdisipliner yang powerful
  • • Lifecycle Data Science terdiri dari 6 tahap sistematis
  • • Berbeda dengan Data Analytics dan Data Mining
  • • Tools dan teknologi terus berkembang pesat
  • • Big Data characterized by 5V (Volume, Velocity, Variety, Veracity, Value)

Future Outlook

  • • AutoML dan democratization of AI
  • • Explainable AI untuk transparency
  • • Edge computing dan real-time analytics
  • • Privacy-preserving machine learning
  • • Integration dengan emerging technologies
Data Science: "Transforming Data into Actionable Insights"
14

Evaluasi dan Tugas

Pertanyaan Evaluasi

  1. 1. Jelaskan perbedaan antara Data Science, Data Analytics, dan Data Mining!
  2. 2. Sebutkan dan jelaskan 6 tahap dalam Data Science Lifecycle!
  3. 3. Apa yang dimaksud dengan konsep 5V dalam Big Data?
  4. 4. Berikan 3 contoh aplikasi Data Science dalam kehidupan sehari-hari!

Tugas Praktis

Individual Assignment:

Pilih satu industry (healthcare, finance, e-commerce, dll.) dan buat analisis tentang bagaimana Data Science dapat diterapkan untuk memecahkan masalah bisnis di industry tersebut.

Format Tugas:

  • • Paper 3-5 halaman
  • • Include case study
  • • Tools dan teknologi yang digunakan
  • • Expected outcomes dan benefits

Deadline:

Minggu depan sebelum perkuliahan dimulai

15

Terima Kasih

Data Science - Pertemuan 12

"In God we trust, all others must bring data."

- W. Edwards Deming

Pertanyaan dan Diskusi?
Keep Learning
Keep Coding
Keep Innovating
16