Mass++ TOP
ブログ
報告・まとめ
2018年のMass++プロジェクト
2018年のMass++プロジェクト
2019年6月17日
2018年の開発実績
早速報告を始めたいと思います!(性急やなあ)
昨年度の活動報告では、重要な内容として以下の2件を予告しておりました:
ver.4をJava言語でscratchから書き下ろす(一から全て書き下ろす)。少なくともそのコア部分の開発を完了する。
ver.4をアメリカ質量分析学会 (ASMS) で発表する
結論から言いますと、この2つは共に達成しております !(ぱちぱち)
まずver.4の開発ですが、計画通りJavaによるコーディングを進めて、ソフトウェアとしての最も基本的な構造である
ファイル読み書き(mzML)の基本部分(メタデータ以外)
スペクトル/クロマトグラム(波形)表示
ヒートマップ・スーパーインポーズ・ミラー表示
上記機能の実装は終わっています。ソースコードはGitHubで公開されており、すぐに内容を確認したい方・改造したい方は今すぐにでもダウンロード可能です。但しこれは飽くまでも「ソースコードの公開」であるため、実行できるようにするためにはユーザーが自分で“ビルド”する必要があります(これができる人=「ビルド」の意味が判る人 です、悪しからず)。
「それでは使いにくい、ダウンロードしたらすぐそのまま使えるパッケージ を何故準備しないんだ?」という疑問をお持ちのあなた !はい、仰有るとおりです。そういうパッケージ(“インストーラ ”)は我々も準備する予定ですが、現状ではソフトウェアとしてのコア部分の実装のみで、「実際に仕事に使えるレベルの機能」がまだ揃っていない(と我々が判断している)ため、インストーラは作成していません。言い換えると、実用に耐える最小限の機能が揃った段階で、最初のインストーラを準備する予定です。そしてその時期は、我々としては今年2019年中にしたいと考えています。
ファイルリードについては、以前からの計画通り外部のソフトウェア(ProteoWizardを想定しています)に任せる予定ですが、このためには「外部ソフトウェアとのデータ受け渡し」機能が必要であり、この機能は2019年6月現在開発中です。
以前もお伝えしたことですが、「様々な企業の独自フォーマットファイルを開く(読む)機能」は元々のMass++の重要な特徴でした(Mass++の開発の当初の動機の一つでもありました)。しかしこの開発には、多数の企業からの協力と開発・テストのための人員が必要であり、また一部のフォーマットについては(テストをするために)その企業の質量分析計が必要です。つまり費用・人員・組織など全ての面について、現在のMass++プロジェクトのような「財政支援なし・少人数開発」体制では到底実施が不可能な作業です。
また、特にSRM測定の定量解析に用いられるオープンソース・ソフトウェアSkyline の開発に同期して、強力なファイルリード機能を持つオープンソース・ソフトウェアProteoWizard の開発が進んでおり、それを利用すれば目的が達成できるため、Mass++ ver.4では開発リソースを他の独自機能に振り分ける予定です。特に、質量分析のオープンソース・ソフトウェアには優れたものも少なくないですが、「高速なビューア」が見当たらないため、そこにはウェイトを置いています。
さて、なんでここでASMSの宣伝をやっとるのかよぅわかりませんが、とにかく以上のような理由から、我々はver.4を「広くお披露目する場」としてASMSを選んだわけです。
2018年の発表実績:ASMSポスター発表
ということで、やってまいりましたサンディエゴ・コンベンション・センター。2018年ASMS会場です。
いや予想どおりですが、何でもばかでかいですね(いや去年のインディアナポリス大会にも別内容の発表のために行ってるんですが、改めて思います)。現に、
!
いや失礼しました、これはサンディエゴの別の写真ですね。会場ではなく会場の前のレストランで撮った写真でした。このステーキはそれほど大きくなかったですね、はい。美味かったですが。
はい、会場入り口玄関部分の柱を振り返って見たところと、ポスター&企業展示会場です。廊下の向かって左側が企業展示、右側がポスターです(ちなみに “No Photography” とあるので、ポスターをちゃんと写さないように撮ってます)。掲示パネルとパネルの間、随分広く見えますが、見間違えではありません、サイズの感覚が掴みにくいですが、実際に広いのです。
こんな感じですね。余裕がたっぷりありますが、人気のあるポスターの前はこれでも窮屈なくらい混雑します。これは早朝「ポスター貼付時間」なのでガラガラですが。なお手前のポスター2枚、これでも内容は読めませんが、手前のポスターはMass++のポスター、その右隣がjPOSTデータベース のポスターで、要は自分たちのポスターです(jPOSTはMass++とは直接の関係はありませんが、関係者が若干被っています)。実はこれ、番号札の順番がここだけおかしくなっていて(413, 414, 416, 415…となっていて)、この後、(番号札ごと)左右を入れ替えて貼り直しています。
ご覧のように、ポスターのパネル自体も大きいです。まぁ当たり前と言えば当たり前ですが、全てサイズが違いますね。ちなみにサイズを間違う と、こういう悲劇(喜劇 ?)が起こります↓
ええ、まぁこちらは、晩飯を食うのが遅くなって、24時間開けているダイナーに23時過ぎに入り、ローストビーフとコーンビーフを注文して、肉だけじゃ駄目か、パンも要るかなあと思ってピザを追加した結果です(野菜がないやん…)。まぁ確かに
挟んであるのは大量のローストビーフ(とチーズ、ピクルス)ですね。嘘じゃないわ。
ところで、アメリカの学校給食ではピザは野菜に分類されると聞きましたが、ホントですかね。「トマトソースが掛かっているから」らしいですが。てことでこの食事も野菜ばっちりです。
で、実は注文した私ら2人(共にMass++開発メンバー)で、これ全部食っちゃった んですが(プラスしてビールとコーラも飲みましたが)、代金とチップをたっぷり払って(サービスが結構よかったので)出ようとしたら、最後のほうで給仕をちょっと手伝ってくれてた若いアフリカ系のウェイターの兄ちゃんが追いかけてきて、あれfist bumpっていうんですか、私と拳骨合わせる挨拶してくれました。あれきっと、ウェイターの間で「あのアホども、全部食うだろか?残すに違いない」とか賭けしてたんじゃないかと(笑
まぁ他にもですね、サンディエゴって実は寿司が美味いんですが(日本人がやってる店の場合)、これもサイズが変ですね。
ええ、ネタも大きいですね。やっぱりサイズが変です。ちなみにこの寿司、一人100ドル以上掛かりました。アメリカは食事が安いので、これは日本での感覚だと一人2万円くらいじゃないかと思います。そら美味いの当たり前やわ。
えっとすみません話が完全に 脱線してますね。サンディエゴでの学会の話が、いつの間にかサンディエゴで何を食ったかの話に化けてます。はい、それで我がMass++のポスターはこんな感じでした:
字が多いですね。もう少しスクリーンショットなどが入れられればよかったんですが、今回は「基本的なプログラムの枠組みを作ることができた」という内容で、判りやすい画面表示などはまだできていません(でした)。
それでも、結論から言いますと、殆ど休む間もないくらいお客さんが来て、reprint request(ポスターのPDFコピーの請求で、論文の別刷り請求に相当する。前述のように学会webからポスターPDFは入手可能なので、これは現在では「関心の強さ」をアピールする象徴的な意味が強いと思われる)は10件を超えました。前回Mass++についてASMSで発表したのは2013年、論文発表は2014年であることを考えると、4~5年の空白の後のこの反応は悪くない手応えである、と我々は感じています。
今後も毎年、それが難しそうなら隔年くらいで、ASMSで発表を継続できるよう、開発を進めていきたい、と我々は考えています。
ということで、サンディエゴ発表のまとめ:美味かったです、ご馳走さまでした!
2018年の発表実績:その他
2018年はASMS以外には特別な発表は行っていません。その代わり、といっては何ですが、書籍にMass++を登場させることができました。
この書籍は、2006年に講談社から発行されて好評を博した『初めてのバイオインフォマティクス 』(藤博幸編)の新版で、内容と各章の著者を一新したことから書籍名も『よくわかるバイオインフォマティクス入門 』と変わっています。この中に『プロテオーム解析』の章が新しくできたのですが(残念ながらメタボローム解析やグライコーム解析といった章はありませんでした)、ここでm/z とretention time、ion signal intensityの3次元立体図を掲載するためにMass++ ver.2.7.5を使用し、名称とユーザー会webを記載しています:
(掲載された図の一部分です。図全体は講談社が版権を有しているので、ここでは掲載を控えます)
次の機会には、是非ともver.4の名前を記載できるようにしたいものです。
2019年の開発・発表予定
2019年はver.4の開発を継続し、「実際に使用可能な状態」を作り出してインストーラを作成する予定です。具体的な機能としては
ピークのアノテーション機能
外部ソフトウェア連携機能(特にピークピッキング周り)
ユーザーインターフェースの拡充
で、これらの開発が一段落すると、インストーラの作成が可能になります。
また今年は、上記の開発目標を達成することを特に重視し、ASMSでの発表(ポスター発表申し込み〆切が2月1日)は取りやめました(いきなり「毎年発表」の野望が崩れていますが、「学会発表のネタになりそうな機能を実装する」ことよりも「確実に動くものを手堅く作る」ことを優先した結果です。来年2020年にはまた、ASMSに出したいですね。2020年の会場は”Houston, we have a problem (本当は Houston, we’ve had a problem ).”の、テキサス州ヒューストンです)。
その代わり今年は、HUPO World Congressのいずれかにポスターを出せるように開発を進める(というか、ポスター発表で申し込みしてしまいました!)、というのが現時点での目標です(現在の実装内容が、メタボロミクスよりもプロテオミクスにやや近いことも、これらの学会を選んだ理由です。将来メタボロミクス寄りの実装を行ったときには、メタボローム・シンポジウムなどもターゲットになり得るでしょう)。
さて、ver.4最初の「インストーラ」のリリースは、果たして何月になりますやら。楽しみであると同時に、やや心配もしているところであります!