Mastering Pong using DQN

(CS 238: Decision Making Under Uncertainty - Capstone Project)

Project Overview

This project implements a Deep Q-Network (DQN) to train an agent to play the classic Atari game Pong using reinforcement learning. The goal of the agent is to maximize the score by learning optimal paddle movements based on the game's state. We

This project highlights key reinforcement learning concepts, including:

Neural network-based Q-value approximation.
Experience replay for stabilizing training.
Reward shaping to accelerate learning.

Features

DQN Architecture: Uses a convolutional neural network to approximate Q-values.
Reward Shaping: Encourages faster learning by providing rewards for:
- Tracking the ball (proximity reward).
- Hitting the ball with the paddle (paddle hit reward).
- Scoring points (score reward).
Experience Replay: Stores past experiences in a replay buffer to improve sample efficiency and break correlation between samples.
Epsilon-Greedy Policy: Balances exploration and exploitation during training.
Metrics Logging: Tracks and saves performance metrics (e.g., rewards, epsilon) during training.

Technical Details

Frameworks:
- Python
- PyTorch for neural network implementation
- OpenAI Gym for the Pong environment
Key Algorithms:
- Deep Q-Learning
- Epsilon-Greedy Action Selection
Architecture:
- Convolutional layers for processing game frames.
- Fully connected layers for Q-value prediction.

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
Assets		Assets
Fonts		Fonts
__pycache__		__pycache__
plots		plots
README.md		README.md
RL.py		RL.py
TETRIS_SIMULATOR.md		TETRIS_SIMULATOR.md
agent.py		agent.py
app.png		app.png
dqn.py		dqn.py
loader.py		loader.py
main.cpython-312.pyc		main.cpython-312.pyc
main.py		main.py
metrics.csv		metrics.csv
pong.py		pong.py
q_table_episode_0.pkl		q_table_episode_0.pkl
q_table_episode_1.pkl		q_table_episode_1.pkl
q_table_episode_10.pkl		q_table_episode_10.pkl
q_table_episode_100.npy		q_table_episode_100.npy
q_table_episode_11.pkl		q_table_episode_11.pkl
q_table_episode_12.pkl		q_table_episode_12.pkl
q_table_episode_13.pkl		q_table_episode_13.pkl
q_table_episode_14.pkl		q_table_episode_14.pkl
q_table_episode_15.pkl		q_table_episode_15.pkl
q_table_episode_16.pkl		q_table_episode_16.pkl
q_table_episode_17.pkl		q_table_episode_17.pkl
q_table_episode_18.pkl		q_table_episode_18.pkl
q_table_episode_19.pkl		q_table_episode_19.pkl
q_table_episode_2.pkl		q_table_episode_2.pkl
q_table_episode_20.pkl		q_table_episode_20.pkl
q_table_episode_21.pkl		q_table_episode_21.pkl
q_table_episode_22.pkl		q_table_episode_22.pkl
q_table_episode_23.pkl		q_table_episode_23.pkl
q_table_episode_24.pkl		q_table_episode_24.pkl
q_table_episode_25.pkl		q_table_episode_25.pkl
q_table_episode_26.pkl		q_table_episode_26.pkl
q_table_episode_27.pkl		q_table_episode_27.pkl
q_table_episode_28.pkl		q_table_episode_28.pkl
q_table_episode_29.pkl		q_table_episode_29.pkl
q_table_episode_3.pkl		q_table_episode_3.pkl
q_table_episode_30.pkl		q_table_episode_30.pkl
q_table_episode_31.pkl		q_table_episode_31.pkl
q_table_episode_32.pkl		q_table_episode_32.pkl
q_table_episode_33.pkl		q_table_episode_33.pkl
q_table_episode_34.pkl		q_table_episode_34.pkl
q_table_episode_35.pkl		q_table_episode_35.pkl
q_table_episode_36.pkl		q_table_episode_36.pkl
q_table_episode_37.pkl		q_table_episode_37.pkl
q_table_episode_38.pkl		q_table_episode_38.pkl
q_table_episode_39.pkl		q_table_episode_39.pkl
q_table_episode_4.pkl		q_table_episode_4.pkl
q_table_episode_40.pkl		q_table_episode_40.pkl
q_table_episode_41.pkl		q_table_episode_41.pkl
q_table_episode_42.pkl		q_table_episode_42.pkl
q_table_episode_43.pkl		q_table_episode_43.pkl
q_table_episode_44.pkl		q_table_episode_44.pkl
q_table_episode_45.pkl		q_table_episode_45.pkl
q_table_episode_46.pkl		q_table_episode_46.pkl
q_table_episode_47.pkl		q_table_episode_47.pkl
q_table_episode_48.pkl		q_table_episode_48.pkl
q_table_episode_49.pkl		q_table_episode_49.pkl
q_table_episode_5.pkl		q_table_episode_5.pkl
q_table_episode_6.pkl		q_table_episode_6.pkl
q_table_episode_7.pkl		q_table_episode_7.pkl
q_table_episode_8.pkl		q_table_episode_8.pkl
q_table_episode_9.pkl		q_table_episode_9.pkl

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Mastering Pong using DQN

(CS 238: Decision Making Under Uncertainty - Capstone Project)

Project Overview

Features

Technical Details

About

Releases

Packages

Contributors 2

Languages

kurysauce/CS-238-Project

Folders and files

Latest commit

History

Repository files navigation

Mastering Pong using DQN

(CS 238: Decision Making Under Uncertainty - Capstone Project)

Project Overview

Features

Technical Details

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages