LifeScience Hack

生物系創薬研究者がAI(誇大表示)を手に入れるまでの過程(Python、Deep Learning、ライフサイエンス)

Uniprotからxmlを取ってきたときにうまくパースできずに困った話

お久しぶりになりました。
相変わらず、ちょこまかといろいろやっております。

最近、UniProtからデータを引っこ抜くことが多いのですが、
UniProtからxmlでデータを取得した後、pythonのlxmlで目的の項目を抜き出す際に
ちょっとしたトラップがありました。
その際に詰まったことがありましたので、メモ代わりに記事にします。

  • UniProtとは
  • UniProt APIを用いてデータ取得
  • xmlを用いてparseできない????
  • uniprotのxml parseには名前空間の指定が必要
  • 名前空間を指定してxmlをparseする
続きを読む

Pythonでtar.gzファイルを解凍する

次世代シークエンサーの登場により、最近は数十Gから数百Gといった巨大なデータを扱うことが多くなってきました。
それに伴い、最近はLinux等で見られるtarファイルやtar.gzファイルを解凍する機会も多いです。
そこで、今回はPythonでこれらのファイルを解凍する方法を記載します。

  • ファイルの種類について
    • tar、tar.gzとは
  • 解凍のためのスクリプト
    • tar.gzの解凍と保存
続きを読む

PCRプライマーのTm値の計算機を作ってみよう③~pythonで実装編~

前回の記事を見ていただければ、Tm値の計算方法は分かったかとおもいます。
今回は、実際にPythonで実装していきたいと思います。
そんなに高度なことはありません。

計算方法を知りたいのではなく、
手っ取り早く今、Tm値を計算したいんだよ!!という方はこちら

lifesciencehack-ai.hatenablog.com

Pythonの基本的な使い方から勉強されたい方は、

がお勧めです。

最後までよろしくおねがいします。

  • Wallace法による計算
    • 各塩基のカウント
    • Wallace法によるTm値の算出
  • 最近接塩基対法による計算
    • パラメータ辞書の作成
    • 隣接ペアの抽出
    • ΔHとΔSの総和を求める
    • 最近接塩基対法によるTm値の算出
続きを読む

PCRプライマーのTm値の計算機を作ってみよう②~Tm値の計算法~

それではいよいよTm値を計算していきましょう。

計算方法を知りたいのではなく、
手っ取り早く今、Tm値を計算したいんだよ!!という方はこちら

lifesciencehack-ai.hatenablog.com

↓↓これまでの記事はこちら↓↓

● PCRプライマーのTm値の計算機を作ってみよう -0-

● PCRプライマーのTm値の計算機を作ってみよう① 〜相補鎖配列とGC含量の計算〜

  • Wallace法
  • 最近接塩基対法
    • 最近接塩基対法のパラメーター一覧
    • 最近接塩基対法の実際の計算方法
続きを読む

PCRプライマーのTm値の計算機を作ってみよう①~相補鎖配列とGC含量の計算~

PythonPCRプライマーのTm値計算機を作るシリーズです。 第1回の今回は、相補鎖配列の表示とGC含量の計算を行いたいと思います。
シリーズの中では比較的簡単ですが、Tm値計算機には必須の機能だと思います。
Pythonの基本的な機能、文字列の操作と計算で可能です。
さっそく作ってきたいと思います。

  • 相補鎖配列の取得
    • 文字列のリバース
    • 塩基対の変換
  • GC含量の計算
    • GC数をカウント
    • GC%を算出
続きを読む

PCRプライマーのTm値の計算機を作ってみよう -0-

lifesciencehack-ai.hatenablog.com

何かを作りながらPythonの基礎を学ぼうかと思います。
仕事で使えそうなもののほうがモチベーションが上がるので、
今回はPCRで使うプライマーのTm値計算機を作ってみます。
また、細かく書いていきたいのでシリーズになります。

構想

プライマーのTm値の計算法を理解する
  1. Wallace法
  2. 最近接塩基対法 lifesciencehack-ai.hatenablog.com
Pythonを使って次のようなことができるようにする
  1. プライマーの配列を入れるとTm値を返す
  2. 相補鎖配列を返す
  3. GC%を返す
  4. エクセルに配列を入れるとバッチ処理してくれる

lifesciencehack-ai.hatenablog.com

lifesciencehack-ai.hatenablog.com

続きを読む

Pythonで論文情報をまとめてゲットする⑤ ~ Openpyxlを使ってExcelファイルとして保存する ~ 

今回はこれまでにゲットした情報をExcelに保存したいと思います。

これまでの記事はこちら
● Pythonで論文情報をまとめてゲットする①~ PubMed APIについて~
● Pythonで論文情報をまとめてゲットする②~ 下準備 ~
● Pythonで論文情報をまとめてゲットする③~ ESearchを使ってPMIDを取得 ~
● Pythonで論文情報をまとめてゲットする④~ ESummaryを使って論文タイトルを取得 ~

  • ライブラリのimport
  • Pandas データフレームの作成
    • 空のデータフレームを作成
    • データフレームへの格納
  • OpenpyxlでExcel fileとして書き出す
    • 必要なライブラリのインポート
    • Bookの作成とシートの設定
    • スタイルの設定値を決める
    • pandasデータフレームをopenpyxlのシートへ書き込む
    • 設定したスタイルを適用する
    • エクセルファイルの保存
続きを読む