For getting Chemical Structure with PubChemPy and RDKit
今回, パッケージインストールにはpip
コマンドを使用します
$ pip install pubchempy
Command 'pip' not found, but can be installed with:
sudo apt install python3-pip
と出たときは
$ sudo apt update
$ sudo apt install python3-pip
と入力してpipをインストールしましょう1).
今回はPython3をインストールしているので, Pyhtonファイルの実行は
$ python3 hogehoge.py
になります3).
pipをインストールしてpipコマンドが使用できるようになったので, 早速構造式を取得するのに必要なモジュールをインストールしていきます.
今回はPubChemPy
とRDKit
をインストールする必要があるので
$ pip install pubchempy
$ pip install rdkit
と入力してPubChemPyパッケージとRDKitパッケージをインストールしましょう1,4).
いよいよ本題です.
構造式の取得にはDraw.MolToImage(molecule)
が用いられます.
molecule = Chem.MolFromSmiles('[SMILES]')
Draw.MolToImage(molecule)
変数moleculeにはCanonical SMILESのデータを分子情報に変換して代入しています. 今回はアスピリン(アセチルサリチル酸)の構造式を取得します.
import pubchempy as pcp
from rdkit import Chem
from rdkit.Chem import Draw
# アスピリンの構造を取得
aspirin = Chem.MolFromSmiles('CC(=O)OC1=CC=CC=C1C(=O)O')
Draw.MolToFile(aspirin, 'aspirin.png')
このファイルを実行して得られたaspirin.png
は以下のようになります.
今年半ばに実験にてPubChemPyに触れたっきりだったので記事を書くのにも意外と時間がかかって しまいましたが, 誰かの参考になれば嬉しいです. また, 分子間の関係について書く機会があれば, またその時に続きの記事を書きます.
- 化学の新しいカタチ 化合物データベースPubChemをpythonで使いこなす https://future-chem.com/pub-chem-py/
- Pythonマニア Ubuntuにpipコマンドがない | インストール方法や注意点を解説します https://pythonmaniac.com/ubuntu-pip/#index_id2
- OFFICE54 【Ubuntu】Pythonの実行方法:スクリプトやコマンドによる実行について https://office54.net/iot/linux/ubuntu-python-run#google_vignette
- 化学の新しいカタチ RDKitでケモインフォマティクスに入門 https://future-chem.com/rdkit-intro/#toc4