본문 바로가기

전체 글

(20)

Mujoco 환경 세팅 - 참고용 Mujoco 환경 세팅 1. Anaconda 설치 1.1 www.anaconda.com/products/individual 1.2 본인 컴퓨터와 호환되는 버전 찾아서 다운로드(일반적으로 list중에 가장 위에서 있는 것 사용하면 됩니다) (1.2.1 sha256sum 으로 무결성 확인) 1.3 sudo bash [Anaconda....다운받은 sh 이름] 중간중간 나오는 것들 Enter 혹은 YES (첫 Yes를 입력하는 부분에서 현재 유저 디렉토리가 맞는지 확인 필요. 종종 그냥 root 로 되어 있는 경우 있음. root인 경우 /home/[유저 이름]/anaconda3 를 입력해준다) e.g. [/root/anaconda3] >>> /home/ai1/anaconda3 1.4 설치가 완료된 후 Ana..

Reference Learning and Control as Probabilistic Inference: Tutorial and Review 논문 리뷰 리뷰 작성: 김장원 (jangwonkim@postech.ac.kr) 논문 리뷰 슬라이드 작업본입니다.https://www.slideshare.net/ssuserbd1647/control-as-inferencepptx

MJCF 파일 분석(5) - 나만의 Manipulator task를 mujoco에서 만들자 작성자 : 김한결 / 석박통합과정 (gksruf621@postech.ac.kr) 원래는 XML 파일과 Env가 전부 포함된 파일을 git에 올리고 공개하려고 했는데 비슷한 내용으로 일을 하게되어 추후 공개 허락을 받고 공개하도록 하겠습니다. 그래도 여기까지 읽어주신 분들을 위해 대략적으로 어떤 방식으로 만들었는지를 공유하려고 합니다. MJCF 파일 분석(4)에서 언급했던 의 Indy7_OpenDoorEnv class를 담은 python 파일에 필요한 내용들을 살펴보겠습니다. 1. mujoco_env.MujocoEnv 2. _get_obs 3. step 4. reset_model 5. viewer_setup 6. reward shaping 이미 gym에 존재한 파일들을 살펴보시면 위 내용은 쉽게 파악하실 ..

MJCF 파일 분석(4) - 나만의 Manipulator task를 mujoco에서 만들자 작성자 : 김한결 / 석박통합과정 (gksruf621@postech.ac.kr) MJCF 파일 분석(3)까지 내용으로 MJCF 파일에 대한 분석은 대부분 끝이 났다. 이제부터는 python으로 environment를 만들때 어떻게 해야되는 지를 살펴보면 된다.(reward design이나 observation 가져오기 등등) 연구실 형이 최근에 quadruped 로봇을 gym으로 불러오게끔 만들어 놓은게 있는데 이를 사용해보기로 했다. (MJCF 파일 분석(1)에서 최대한 library dependency를 줄이고자 한다고 해놓고...그래도 gym이 하는 일이 거의 없기 때문에...) 그래서 이번 글은 반성의 의미로 gym이 어떻게 모델을 불러오는지 간단히 정리해보려고 한다. 우선 gym은 패키지이기 때..

MJCF 파일 분석(3) - 나만의 Manipulator task를 mujoco에서 만들자 작성자 : 김한결 / 석박통합과정 (gksruf621@postech.ac.kr) MJCF 파일 분석(2)에 이어서 environment를 만들어 보려고 한다. 처음에는 아래 링크에 reference가 아주 친절하게 나와있기 때문에 만만히 봤는데, API가 C++ 기반으로 작성되었다보니 생각보다 까다로웠다. 그래도 mujoco 라이브러리안에 "robotics"나 "mujoco"를 참고하면 비교적 쉽게 따라할 수 있으며, mujoco-py 1.50.0버전 refer도 제공하고 있다. MuJoCo reference https://mujoco.readthedocs.io/en/latest/APIreference.html#mjmodel API Reference — MuJoCo documentation These a..

MJCF 파일 분석(2) - 나만의 Manipulator task를 mujoco에서 만들자 작성자 : 김한결 / 석박통합과정 (gksruf621@postech.ac.kr) 주말동안 Baxter의 mjcf를 분석하고 정리해보았다. 우선 MJCF 파일 분석(1)에서 control이 안되는 이유는 구글링해서 얻을 수 있는 XML 파일에는 actuator가 선언되어 있지 않기 때문이다. actuator를 추가한 이후에 MJCF 파일 분석(1) ./simulator로 baxter를 실행시켜보면 다음과 같다. 나만의 Task를 만들기 위해서는 다른 object를 넣어야하는데 기존 Baxter는 asset과 actuator, body등이 모두 한 XML 파일 안에 들어가 있기 때문에 추후 다른 environment를 생성하는데 까다롭다. (이런 면에서 robosuite가 잘 만들어졌다는 걸 새삼 깨닫습니다..

MJCF 파일 분석(1) - 나만의 Manipulator task를 mujoco에서 만들자 작성자 : 김한결 / 석박통합과정 (gksruf621@postech.ac.kr) MJCF에 대해 친절하게 다룬 글이 아닙니다. 대충 어떤 흐름으로 개발 하는지만 살펴주세요. 최종 목표: 나만의 Manipulator task를 mujoco에서 만들자 Baxter를 Mujoco 환경에서 사용해보고자 하는데 XML 파일을 mujoco로 simulator로 실행해보니 control이 되지 않는다. (만들어진 것만 쓴 폐해...) MJCF와 mujoco environment에 대한 이해가 필요하다고 생각해 처음부터 차근차근 공부한다 생각하며 기록을 남기려고 한다.(robotsuite를 사용하는 방법도 있지만 최대한 library dependency를 줄이고자 한다) 이번글은 다음 영상을 축약한 내용이다. http..

Variational Adversarial Imitation Learning (VAIL) 논문리뷰 리뷰 작성: 김한결 / 석사과정 (gksruf621@postech.ac.kr) Variational Adversarial Imitation Learning이 등장하는 논문의 본래 이름은 Variational Discriminator Bottleneck: Improving Imitation Learning, Inverse RL, and GANs by Constraining Information Flow입니다. Variational Discriminator Bottleneck (VDB)논문에서는 GAN과 같은 Adversarial learning methods를 제안한 것이기 때문에 Imitation Learning 뿐만 아니라 이미지 생성과 같은 다른 Task들이 존재합니다. 저희는 Imitation Le..

목록 더보기

티스토리툴바