QM7 dataset 설명
QM7 dataset은 MoculeNet 논문에 소개된 dataset으로써, GDB-13의 subset data이다. Dataset은 23개까지 이루어진 7165개 분자들을 표현하고 있다. 전체적으로 dataset은 C, H, N, O, S의 5개의 고유 원자들로 이루어져 있다.
분자들은 SMILES strings를 통해 문자로 구성 원자들이 표현된다. 매우 간략히 말하면, 이중결합은 =, 수소는 표현 생략 등으로 표현한다.
댓글
댓글 쓰기