diff --git a/docs/_snippets/plano_aula_1.md b/docs/_snippets/plano_aula_1.md new file mode 100644 index 0000000..ec9a1a4 --- /dev/null +++ b/docs/_snippets/plano_aula_1.md @@ -0,0 +1,41 @@ +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
05-FevApresentação da disciplina e Introdução à Aprendizagem por ReforçoAula expositiva com debate e resolução de exercícios
07-FevAgente Autônomo e Busca em Espaço de EstadosAula expositiva com roteiro de implementação.
12-FevCarnavalCarnaval
14-FevCarnavalCarnaval
19-FevBusca em Espaço de Estados e Teoria de JogosApresentação do problema e implementação da solução em grupo.
21-FevBusca em Espaço de Estados e Teoria de JogosImplementação da solução para um problema de busca competitiva e discussão dos resultados.

\ No newline at end of file diff --git a/docs/_snippets/plano_aula_2.md b/docs/_snippets/plano_aula_2.md new file mode 100644 index 0000000..7f6a272 --- /dev/null +++ b/docs/_snippets/plano_aula_2.md @@ -0,0 +1,41 @@ +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
26-FevAlgoritmo Q-LearningAula expositiva acom roteiro de implementação.
28-FevAlgoritmo Q-Learning, ferramentas para Reinforcement Learning e Environments.Aula expositiva acom roteiro de implementação.
4-MarçoAlgoritmo SARSAAula expositiva acom roteiro de implementação.
6-MarçoComo avaliar a performance de um agente e sua curva de aprendizadoAula expositiva acom roteiro de implementação.
11-MarçoUsando RL em ambiente não-determinísticosApresentação do problema e implementação da solução em grupo.
13-MarçoRevisão: Q-Learning, SARSA, ambientes determinísticos ou não, avaliação de agentesDebate em sala de aula sobre resultados alcançados até então com as implementações realizadas.

\ No newline at end of file diff --git a/docs/_snippets/plano_aula_3.md b/docs/_snippets/plano_aula_3.md new file mode 100644 index 0000000..a9d47a0 --- /dev/null +++ b/docs/_snippets/plano_aula_3.md @@ -0,0 +1,51 @@ +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
18-MarçoImplementando um agente que precisa lidar com um ambiente mais complexoApresentação do problema e implementação da solução em grupo.
20-MarçoDeep Q-LearningAula expositiva acom roteiro de implementação.
25-MarçoRevisão sobre Redes Neurais e decisões de projeto de RN para RLAula expositiva acom roteiro de implementação.
27-MarçoRevisão sobre Redes Neurais e decisões de projeto de RN para RLAula expositiva acom roteiro de implementação.
1-AbrilAvaliação Intermediária - implementação do projeto 1Avaliação Intermediária - implementação do projeto 1
3-AbrilAvaliação Intermediária - implementação do projeto 1Avaliação Intermediária - implementação do projeto 1
8-AbrilAlgoritmo ReinforceAula expositiva acom roteiro de implementação.
10-AbrilComparando Deep Q-Learning e ReinforceAula expositiva acom roteiro de implementação.

\ No newline at end of file diff --git a/docs/_snippets/plano_aula_4.md b/docs/_snippets/plano_aula_4.md new file mode 100644 index 0000000..52794bf --- /dev/null +++ b/docs/_snippets/plano_aula_4.md @@ -0,0 +1,41 @@ +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
15-AbrilDeep Deterministic Policy Gradient (DDPG)Aula expositiva acom roteiro de implementação.
17-AbrilDeep Deterministic Policy Gradient (DDPG)Aula expositiva acom roteiro de implementação.
22-AbrilPolicy Optimization Algorithms (PPO)Aula expositiva acom roteiro de implementação.
24-AbrilPolicy Optimization Algorithms (PPO)Aula expositiva acom roteiro de implementação.
29-AbrilReutilizando implementações de DDPG e PPO em projetosAula expositiva acom roteiro de implementação.
01-MaioFeriadoFeriado

\ No newline at end of file diff --git a/docs/_snippets/plano_aula_5.md b/docs/_snippets/plano_aula_5.md new file mode 100644 index 0000000..3c786aa --- /dev/null +++ b/docs/_snippets/plano_aula_5.md @@ -0,0 +1,51 @@ +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
6-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
8-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
13-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
15-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
20-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
22-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
27-MaioAvaliação FinalAvaliação Final
29-MaioAvaliação FinalAvaliação Final

\ No newline at end of file diff --git a/docs/plan.md b/docs/plan.md index 32454cc..b9970ff 100644 --- a/docs/plan.md +++ b/docs/plan.md @@ -1,5 +1,29 @@ -# Plan +# Plano de aula -The following activities are planned. The program is always subject to changes and adjustments as the course is performed. +O plano de aula desta disciplina está divido em **cinco** (5) blocos. Para cada bloco as seguintes atividades estão planejadas. + +??? "Atenção!" + + O programa está sempre sujeito a alterações e adaptações conforme as disciplina é executada. + + +## Introdução sobre Aprendizagem por Reforço e Revisão sobre Agentes Autônomos + +--8<-- "plano_aula_1.md" + +## Algoritmos Tabulares (Q-Learning e Sarsa) + +--8<-- "plano_aula_2.md" + +## Deep Reinforcement Learning: value-based e policy gradient + +--8<-- "plano_aula_3.md" + +## Deep Reinforcement Learning: actor-critic + +--8<-- "plano_aula_4.md" + +## Projeto Final + +--8<-- "plano_aula_5.md" ---8<-- "plan.md" \ No newline at end of file diff --git a/lessons_plan.xlsx b/lessons_plan.xlsx index cf5eeaf..4467a1d 100644 Binary files a/lessons_plan.xlsx and b/lessons_plan.xlsx differ diff --git a/publish_lessons_plan.py b/publish_lessons_plan.py index 1eea669..6d08309 100644 --- a/publish_lessons_plan.py +++ b/publish_lessons_plan.py @@ -1,9 +1,41 @@ -import tabulate import pandas as pd +from pretty_html_table import build_table -t1 = pd.read_excel('lessons_plan.xlsx') -t1['Date'] = t1['Date'].apply(lambda x: x.strftime('%m/%d')) +def redefine_strong(tabela): + tabela = tabela.replace('<strong>','') + tabela = tabela.replace('</strong>','') + return tabela -with open('docs/_snippets/plan.md', 'w') as f: - tabela_str = tabulate.tabulate(t1[['Data', 'Conteúdo','Programação/Atividade']], headers=['Data', 'Conteúdo','Programação/Atividade'], tablefmt='pipe', showindex=False) - f.write(tabela_str) +df = pd.read_excel('lessons_plan.xlsx') + +parte1 = build_table(df.iloc[0:6][['Data', 'Conteúdo','Programação/Atividade']], + color='blue_dark') +parte1 = redefine_strong(parte1) +with open('docs/_snippets/plano_aula_1.md', 'w') as f: + f.write(parte1) + +parte2 = build_table(df.iloc[6:12][['Data', 'Conteúdo','Programação/Atividade']], + color='yellow_dark') +parte2 = redefine_strong(parte2) +with open('docs/_snippets/plano_aula_2.md', 'w') as f: + f.write(parte2) + +parte3 = build_table(df.iloc[12:20][['Data', 'Conteúdo','Programação/Atividade']], + color='green_dark') +parte3 = redefine_strong(parte3) +with open('docs/_snippets/plano_aula_3.md', 'w') as f: + f.write(parte3) + + +parte4 = build_table(df.iloc[20:26][['Data', 'Conteúdo','Programação/Atividade']], + color='red_dark') +parte4 = redefine_strong(parte4) +with open('docs/_snippets/plano_aula_4.md', 'w') as f: + f.write(parte4) + + +parte5 = build_table(df.iloc[26:][['Data', 'Conteúdo','Programação/Atividade']], + color='yellow_dark') +parte5 = redefine_strong(parte5) +with open('docs/_snippets/plano_aula_5.md', 'w') as f: + f.write(parte5) diff --git a/requirements.txt b/requirements.txt index 0c70b4a..787f7fd 100644 --- a/requirements.txt +++ b/requirements.txt @@ -9,3 +9,4 @@ openpyxl pytest pylint mkdocs-bibtex +pretty_html_table diff --git a/site/_snippets/plano_aula_1/index.html b/site/_snippets/plano_aula_1/index.html new file mode 100644 index 0000000..218aab4 --- /dev/null +++ b/site/_snippets/plano_aula_1/index.html @@ -0,0 +1,453 @@ + + + + + + + + + + + + + + + + + + + + Plano aula 1 - Reinforcement Learning + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ +
+
+ +
+ + + + +
+ + +
+ +
+ + + + + + +
+
+ + + +
+
+
+ + + + +
+
+
+ + + +
+
+
+ + + +
+
+
+ + + +
+
+ + + + + +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
05-FevApresentação da disciplina e Introdução à Aprendizagem por ReforçoAula expositiva com debate e resolução de exercícios
07-FevAgente Autônomo e Busca em Espaço de EstadosAula expositiva com roteiro de implementação.
12-FevCarnavalCarnaval
14-FevCarnavalCarnaval
19-FevBusca em Espaço de Estados e Teoria de JogosApresentação do problema e implementação da solução em grupo.
21-FevBusca em Espaço de Estados e Teoria de JogosImplementação da solução para um problema de busca competitiva e discussão dos resultados.

+ +
+
+ + + Last update: + February 2, 2024 + + + +
+ + + + + + +
+
+ + +
+ +
+ + + +
+
+
+
+ + + + + + + + + + + + + + + + + + + \ No newline at end of file diff --git a/site/_snippets/plano_aula_2/index.html b/site/_snippets/plano_aula_2/index.html new file mode 100644 index 0000000..1d22bb0 --- /dev/null +++ b/site/_snippets/plano_aula_2/index.html @@ -0,0 +1,453 @@ + + + + + + + + + + + + + + + + + + + + Plano aula 2 - Reinforcement Learning + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ +
+
+ +
+ + + + +
+ + +
+ +
+ + + + + + +
+
+ + + +
+
+
+ + + + +
+
+
+ + + +
+
+
+ + + +
+
+
+ + + +
+
+ + + + + +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
26-FevAlgoritmo Q-LearningAula expositiva acom roteiro de implementação.
28-FevAlgoritmo Q-Learning, ferramentas para Reinforcement Learning e Environments.Aula expositiva acom roteiro de implementação.
4-MarçoAlgoritmo SARSAAula expositiva acom roteiro de implementação.
6-MarçoComo avaliar a performance de um agente e sua curva de aprendizadoAula expositiva acom roteiro de implementação.
11-MarçoUsando RL em ambiente não-determinísticosApresentação do problema e implementação da solução em grupo.
13-MarçoRevisão: Q-Learning, SARSA, ambientes determinísticos ou não, avaliação de agentesDebate em sala de aula sobre resultados alcançados até então com as implementações realizadas.

+ +
+
+ + + Last update: + February 2, 2024 + + + +
+ + + + + + +
+
+ + +
+ +
+ + + +
+
+
+
+ + + + + + + + + + + + + + + + + + + \ No newline at end of file diff --git a/site/_snippets/plano_aula_3/index.html b/site/_snippets/plano_aula_3/index.html new file mode 100644 index 0000000..964b27b --- /dev/null +++ b/site/_snippets/plano_aula_3/index.html @@ -0,0 +1,463 @@ + + + + + + + + + + + + + + + + + + + + Plano aula 3 - Reinforcement Learning + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ +
+
+ +
+ + + + +
+ + +
+ +
+ + + + + + +
+
+ + + +
+
+
+ + + + +
+
+
+ + + +
+
+
+ + + +
+
+
+ + + +
+
+ + + + + +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
18-MarçoImplementando um agente que precisa lidar com um ambiente mais complexoApresentação do problema e implementação da solução em grupo.
20-MarçoDeep Q-LearningAula expositiva acom roteiro de implementação.
25-MarçoRevisão sobre Redes Neurais e decisões de projeto de RN para RLAula expositiva acom roteiro de implementação.
27-MarçoRevisão sobre Redes Neurais e decisões de projeto de RN para RLAula expositiva acom roteiro de implementação.
1-AbrilAvaliação Intermediária - implementação do projeto 1Avaliação Intermediária - implementação do projeto 1
3-AbrilAvaliação Intermediária - implementação do projeto 1Avaliação Intermediária - implementação do projeto 1
8-AbrilAlgoritmo ReinforceAula expositiva acom roteiro de implementação.
10-AbrilComparando Deep Q-Learning e ReinforceAula expositiva acom roteiro de implementação.

+ +
+
+ + + Last update: + February 2, 2024 + + + +
+ + + + + + +
+
+ + +
+ +
+ + + +
+
+
+
+ + + + + + + + + + + + + + + + + + + \ No newline at end of file diff --git a/site/_snippets/plano_aula_4/index.html b/site/_snippets/plano_aula_4/index.html new file mode 100644 index 0000000..f439c70 --- /dev/null +++ b/site/_snippets/plano_aula_4/index.html @@ -0,0 +1,453 @@ + + + + + + + + + + + + + + + + + + + + Plano aula 4 - Reinforcement Learning + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ +
+
+ +
+ + + + +
+ + +
+ +
+ + + + + + +
+
+ + + +
+
+
+ + + + +
+
+
+ + + +
+
+
+ + + +
+
+
+ + + +
+
+ + + + + +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
15-AbrilDeep Deterministic Policy Gradient (DDPG)Aula expositiva acom roteiro de implementação.
17-AbrilDeep Deterministic Policy Gradient (DDPG)Aula expositiva acom roteiro de implementação.
22-AbrilPolicy Optimization Algorithms (PPO)Aula expositiva acom roteiro de implementação.
24-AbrilPolicy Optimization Algorithms (PPO)Aula expositiva acom roteiro de implementação.
29-AbrilReutilizando implementações de DDPG e PPO em projetosAula expositiva acom roteiro de implementação.
01-MaioFeriadoFeriado

+ +
+
+ + + Last update: + February 2, 2024 + + + +
+ + + + + + +
+
+ + +
+ +
+ + + +
+
+
+
+ + + + + + + + + + + + + + + + + + + \ No newline at end of file diff --git a/site/_snippets/plano_aula_5/index.html b/site/_snippets/plano_aula_5/index.html new file mode 100644 index 0000000..4aba7e1 --- /dev/null +++ b/site/_snippets/plano_aula_5/index.html @@ -0,0 +1,463 @@ + + + + + + + + + + + + + + + + + + + + Plano aula 5 - Reinforcement Learning + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+ +
+
+ +
+ + + + +
+ + +
+ +
+ + + + + + +
+
+ + + +
+
+
+ + + + +
+
+
+ + + +
+
+
+ + + +
+
+
+ + + +
+
+ + + + + +

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
6-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
8-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
13-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
15-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
20-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
22-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
27-MaioAvaliação FinalAvaliação Final
29-MaioAvaliação FinalAvaliação Final

+ +
+
+ + + Last update: + February 2, 2024 + + + +
+ + + + + + +
+
+ + +
+ +
+ + + +
+
+
+
+ + + + + + + + + + + + + + + + + + + \ No newline at end of file diff --git a/site/assessment/index.html b/site/assessment/index.html index e403a48..bd150a4 100644 --- a/site/assessment/index.html +++ b/site/assessment/index.html @@ -527,7 +527,7 @@

Conversão de conceito para v Last update: - May 9, 2023 + February 2, 2024 diff --git a/site/classes/01_introduction/index.html b/site/classes/01_introduction/index.html index ca8fd72..bb8c36e 100644 --- a/site/classes/01_introduction/index.html +++ b/site/classes/01_introduction/index.html @@ -501,7 +501,7 @@

Referências

Last update: - February 1, 2024 + February 2, 2024 diff --git a/site/classes/01_introduction/subject_rules/index.html b/site/classes/01_introduction/subject_rules/index.html index 2a5b3e4..97178e3 100644 --- a/site/classes/01_introduction/subject_rules/index.html +++ b/site/classes/01_introduction/subject_rules/index.html @@ -443,7 +443,7 @@

Assignments

Last update: - February 7, 2023 + February 2, 2024 diff --git a/site/classes/02_problem_solving/index.html b/site/classes/02_problem_solving/index.html index bdb7d94..6bb2a29 100644 --- a/site/classes/02_problem_solving/index.html +++ b/site/classes/02_problem_solving/index.html @@ -602,7 +602,7 @@

Entrega

Last update: - February 22, 2023 + February 2, 2024 diff --git a/site/plan/index.html b/site/plan/index.html index e0f6952..5c16f0a 100644 --- a/site/plan/index.html +++ b/site/plan/index.html @@ -71,7 +71,7 @@
- + Skip to content @@ -196,10 +196,69 @@ + + Plano + + + + @@ -351,6 +410,49 @@ + + +
@@ -365,154 +467,246 @@ -

Plan

-

The following activities are planned. The program is always subject to changes and adjustments as the course is performed.

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
DateContent
02/07Introduction to Reinforcement Learning
02/09Problem-solving searching review
02/14Problem-solving, Adversarial search and games review
02/16Problem-solving, Adversarial search and games review
02/23Q-Learning Algorithm
02/28Q-Learning Algorithm, Reinforcement Learning Tooling and Environments
03/02SARSA Algorithm
03/07How to evaluate the performance of an agent
03/09Using RL in non-deterministic environments
03/14Using RL in a competitive environment
03/16Using RL in a competitive environment with random behavior
03/21Implementing an agent to deal with an environment a little more complex
03/23Deep Q-Learning
03/28Deep Q-Learning
03/30Midterm assessment - we do not have classes
04/04Midterm assessment - we do not have classes
04/06We do not have classes
04/11Deep Q-Learning studio
04/13Deep Q-Learning studio
04/18Double Deep Q-Learning project
04/20Double Deep Q-Learning project
04/25Double Deep Q-Learning project
04/27Double Deep Q-Learning project
05/02Policy Optimization Algorithms (PPO)
05/04Policy Optimization Algorithms (PPO)
05/09Final Project
05/11Final Project
05/16Final Project
05/18Final Project
05/23Final Project
05/25Final Project
05/30Final Project
06/01Final Assessment - we do not have classes
06/06Final Assessment - we do not have classes
+

Plano de aula

+

O plano de aula desta disciplina está divido em cinco (5) blocos. Para cada bloco as seguintes atividades estão planejadas.

+
+Atenção! +

O programa está sempre sujeito a alterações e adaptações conforme as disciplina é executada.

+
+

Introdução sobre Aprendizagem por Reforço e Revisão sobre Agentes Autônomos

+

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
05-FevApresentação da disciplina e Introdução à Aprendizagem por ReforçoAula expositiva com debate e resolução de exercícios
07-FevAgente Autônomo e Busca em Espaço de EstadosAula expositiva com roteiro de implementação.
12-FevCarnavalCarnaval
14-FevCarnavalCarnaval
19-FevBusca em Espaço de Estados e Teoria de JogosApresentação do problema e implementação da solução em grupo.
21-FevBusca em Espaço de Estados e Teoria de JogosImplementação da solução para um problema de busca competitiva e discussão dos resultados.

+ +

Algoritmos Tabulares (Q-Learning e Sarsa)

+

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
26-FevAlgoritmo Q-LearningAula expositiva acom roteiro de implementação.
28-FevAlgoritmo Q-Learning, ferramentas para Reinforcement Learning e Environments.Aula expositiva acom roteiro de implementação.
4-MarçoAlgoritmo SARSAAula expositiva acom roteiro de implementação.
6-MarçoComo avaliar a performance de um agente e sua curva de aprendizadoAula expositiva acom roteiro de implementação.
11-MarçoUsando RL em ambiente não-determinísticosApresentação do problema e implementação da solução em grupo.
13-MarçoRevisão: Q-Learning, SARSA, ambientes determinísticos ou não, avaliação de agentesDebate em sala de aula sobre resultados alcançados até então com as implementações realizadas.

+ +

Deep Reinforcement Learning: value-based e policy gradient

+

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
18-MarçoImplementando um agente que precisa lidar com um ambiente mais complexoApresentação do problema e implementação da solução em grupo.
20-MarçoDeep Q-LearningAula expositiva acom roteiro de implementação.
25-MarçoRevisão sobre Redes Neurais e decisões de projeto de RN para RLAula expositiva acom roteiro de implementação.
27-MarçoRevisão sobre Redes Neurais e decisões de projeto de RN para RLAula expositiva acom roteiro de implementação.
1-AbrilAvaliação Intermediária - implementação do projeto 1Avaliação Intermediária - implementação do projeto 1
3-AbrilAvaliação Intermediária - implementação do projeto 1Avaliação Intermediária - implementação do projeto 1
8-AbrilAlgoritmo ReinforceAula expositiva acom roteiro de implementação.
10-AbrilComparando Deep Q-Learning e ReinforceAula expositiva acom roteiro de implementação.

+ +

Deep Reinforcement Learning: actor-critic

+

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
15-AbrilDeep Deterministic Policy Gradient (DDPG)Aula expositiva acom roteiro de implementação.
17-AbrilDeep Deterministic Policy Gradient (DDPG)Aula expositiva acom roteiro de implementação.
22-AbrilPolicy Optimization Algorithms (PPO)Aula expositiva acom roteiro de implementação.
24-AbrilPolicy Optimization Algorithms (PPO)Aula expositiva acom roteiro de implementação.
29-AbrilReutilizando implementações de DDPG e PPO em projetosAula expositiva acom roteiro de implementação.
01-MaioFeriadoFeriado

+ +

Projeto Final

+

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
DataConteúdoProgramação/Atividade
6-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
8-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
13-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
15-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
20-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
22-MaioAula Studio para execução do projeto finalAula Studio para execução do projeto final
27-MaioAvaliação FinalAvaliação Final
29-MaioAvaliação FinalAvaliação Final


diff --git a/site/sitemap.xml b/site/sitemap.xml index c07451b..596cb7b 100644 --- a/site/sitemap.xml +++ b/site/sitemap.xml @@ -30,6 +30,31 @@ 2024-02-02 daily + + https://insper.github.io/rl/_snippets/plano_aula_1/ + 2024-02-02 + daily + + + https://insper.github.io/rl/_snippets/plano_aula_2/ + 2024-02-02 + daily + + + https://insper.github.io/rl/_snippets/plano_aula_3/ + 2024-02-02 + daily + + + https://insper.github.io/rl/_snippets/plano_aula_4/ + 2024-02-02 + daily + + + https://insper.github.io/rl/_snippets/plano_aula_5/ + 2024-02-02 + daily + https://insper.github.io/rl/classes/01_introduction/ 2024-02-02 diff --git a/site/sitemap.xml.gz b/site/sitemap.xml.gz index fc37432..c7675fd 100644 Binary files a/site/sitemap.xml.gz and b/site/sitemap.xml.gz differ