Out-of-Dynamics Imitation Learning from Multimodal Demonstrations

1. MuJoCo environments.

The implementation for MuJoCo environments is in mujoco/.

Acknowledgement

[1]This repo is based on Learning-Feasibility-Different-Dynamics.
Contrastive clustering algorithm is based on Deep Clustering Network.

2. Driving environment.

The implementation for Driving environment is in carlo/.

Acknowledgement

This repo is based on https://github.com/Stanford-ILIAD/CARLO

3. Simulated Franka Panda Arm.

The implementation for Simulated Franka Panda Arm is in simulated_robot/.

Acknowledgement

This repo is based on https://github.com/ku2482/gail-airl-ppo.pytorch

You can resort to wandb to login your personal account via export your own wandb api key.

export WANDB_API_KEY=YOUR_WANDB_API_KEY

and run

wandb online

to turn on the online syncronization.

References

[1] Z. Cao, Y. Hao, M. Li, and D. Sadigh. Learning feasibility to imitate demonstrators with different dynamics. In CoRL, 2021.

[2] Schulman, John, et al. "Proximal policy optimization algorithms." arXiv preprint arXiv:1707.06347 (2017).

[3] Ho, Jonathan, and Stefano Ermon. "Generative adversarial imitation learning." Advances in neural information processing systems. 2016.

[4] Fu, Justin, Katie Luo, and Sergey Levine. "Learning robust rewards with adversarial inverse reinforcement learning." arXiv preprint arXiv:1710.11248 (2017).

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
carlo		carlo
mujoco		mujoco
simulated_robot		simulated_robot
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
packages.txt		packages.txt
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Out-of-Dynamics Imitation Learning from Multimodal Demonstrations

1. MuJoCo environments.

2. Driving environment.

3. Simulated Franka Panda Arm.

References

About

Releases

Packages

Languages

License

EvieQ01/OODIL

Folders and files

Latest commit

History

Repository files navigation

Out-of-Dynamics Imitation Learning from Multimodal Demonstrations

1. MuJoCo environments.

2. Driving environment.

3. Simulated Franka Panda Arm.

References

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages