QM7 dataset 설명

QM7 dataset은 MoculeNet 논문에 소개된 dataset으로써, GDB-13의  subset data이다. Dataset은 23개까지 이루어진 7165개 분자들을 표현하고 있다. 전체적으로 dataset은 C, H, N, O, S의 5개의 고유 원자들로 이루어져 있다.

분자들은 SMILES strings를 통해 문자로 구성 원자들이 표현된다. 매우 간략히 말하면, 이중결합은 =, 수소는 표현 생략 등으로 표현한다.

 

 

 

댓글

이 블로그의 인기 게시물

로봇의 작업영역(Workspace)

Frenet-Serret formulas (프레네-세레 공식)

yes24 [뷰어 서버의 기본정보가 존재하지 않습니다.] 오류 해결