# Fileset

[谷藤-NIMSのDPF事業4SCJ-2019JanShort.pdf](https://mdr.nims.go.jp/filesets/325d2325-8372-463c-8c47-949357974498/download)

## Creator

[TANIFUJI, Mikiko](https://orcid.org/0000-0001-5284-6364)

## Rights



## Other metadata

[材料科学分野でのデータ利活用 「データプラットフォーム」という取り組み](https://mdr.nims.go.jp/datasets/7570f979-e63e-4afd-9fed-dc1399dde601)

## Fulltext

Microsoft PowerPoint - 谷藤-NIMSのDPF事業4SCJ-2019JanShort1材料科学分野でのデータ利活⽤「データプラットフォーム」という取り組みNIMS情報統合型材料開発部⾨ (MaDIS)材料データプラットフォームセンター (DPFC) センター⻑ ⾕藤 幹⼦2019年1⽉10⽇（⽊）⽇本学術会議第12回情報学シンポジウム「データドリブンエコノミーの実践」2材料データプラットフォームセンター今⽇の材料科学 － データ駆動型研究3第 図 系平衡状態図機械的特性（シャルピー衝撃試験）ミクロ組織写真（光学顕微鏡観察）アルミニウム合金のJISコード体系相図（温度＆化学成分と構造の相関図）機械的特性（引張試験）クリープ曲線（熱＆応力環境下での伸びの時間変化）プロセッシング（叩いて伸ばす）プロセッシング（溶かして固める）プロセッシング（油に漬けて冷やす）プロセッシング（温めて引き伸ばす）例︓データ化したい⾦属材料のあれこれデータをつくる、ためる・つかうデータリポジトリデータ蓄積・保持 研究⽤途として• 材料データベース• 計測データ• 計算データ• 標準データ• 機械学習等で⽣み出すデータ 機関アセットデータとして• 論⽂・補⾜・エビデンスデータ• 報告書データ• 受託事業で得られたデータ• 検証データ• 事故調査記録データ• ⼈プロフィールデータデータ創出 実験、計測 機械学習などによるマイニング、解析 計算、予測 ラボノートデータ活⽤リポジトリでデータ駆動 データを発⾒、統合 データを解析 新たにデータ創出データ公開DOIを付けてデータ出版 データ、データセット データベース 他機関・分野リポジトリとの相互連携データリポジトリ（データの来歴・メタ情報・オープンクローズ制御・品質保証・作者／著者／利⽤者管理）4材料データプラットフォームセンターつかうためには、メタデータという「取説」が必要データ創出 実験、計測 機械学習などによるマイニング、解析 計算、予測 ラボノート5データリポジトリ（データの来歴・メタ情報・オープンクローズ制御・品質保証・作者／著者／利⽤者管理）材料データプラットフォームセンター例︓実験装置からデータを取る時装置依存のファイルを可読な形式に装置依存の⽤語を機械学習可能にデータを使うリポジトリに6#@(#) AP_SFTA1#@(#) AP_SFTA1$AP_SYSTEM_ID  AES-5.30$AP_DATATYPE  3$AP_ACQDATE  20150410163428$AP_PENERGY  10.00$AP_PCURRENT  1.006 8$AP_CLCOARSE  6$AP_CLFINE  221$AP_OLAPERT  3$AP_MAG  300$AP_CHAMBER_PRESS  4.00 7$AP_SPC_ANAMOD  5$AP_SPC_ES  100$AP_SPC_MESMOD  3$AP_SPC_NCEM  7$AP_SPC_CEMSTAT  1 0$AP_SPC_CEMSTAT  2 1$AP_SPC_CEMSTAT  3 1$AP_SPC_CEMSTAT  4 1$AP_SPC_CEMSTAT  5 1$AP_SPC_CEMSTAT  6 1$AP_SPC_CEMSTAT  7 1$AP_SPC_CEMSTAT  8 1$AP_SPC_CEMSTAT  9 0$AP_SPC_SELDMOD  2$AP_SPC_DMOD  1$AP_SPC_PCCEMHV  2300$AP_SPC_VFCEMHV  0$AP_SPC_WSTART  0.00出力データの例Probe energy ? 10.00 keV ?Probe current ? 1.006 E‐8 A ?Chamber vacuum pressure ?     4.00 E‐7 Pa ?Objective lens aperture No. ?    No. 3  ?Acquisition date ? 2015年04月10日 16時34分28秒 ?Condenser lens fine tuning ?     221  ?Spectral analyzer mode ?        5 ?Number of channeltron electron multipliers ?     7 ?Measurement mode ?      3 ?Primary current ? /channeltron electron multiplier/high voltage ?    2300 V ?計測装置が出⼒する⽣データの可読性の低さの実例つかうためには、メタデータという「取説」が必要材料データプラットフォームセンター7材料データプラットフォームセンター77実験装置が出⼒するデータを可読化することで、⾼付加価値化が可能にバイナリの生データテキストファイルフォーマット変換後の数値行列データ（人による可読性に優れる）グラフメタデータ可読化されたデータNi3pユーザーによるフォーマット変換が可能なSchema on Read型のデータ登録システム計測装置メーカーなど、協力機関から提供頂いただくテキスト変換プログラムフォーマット変換後の数値行列データを解読してグラフ化するPythonプログラムNIMSで自作した可読化のための用語（語彙）及びフォーマットの変換プログラム自動でスパース化されたデータメタデータという「取説」が、データの価値を引き出す機械間のデータ互換性⇒インフォマティクスに使う測定データ⇒一元的に収集・分析・大量活用今月公開！メタデータという「取説」とデータファイルがたまると8データリポジトリ（データの来歴・メタ情報・オープンクローズ制御・品質保証・作者／著者／利⽤者管理）データ活⽤リポジトリでデータ駆動 データを発⾒、統合 データを解析 新たにデータ創出個々の実験装置の枠を超えた実験データの利活⽤へ材料データプラットフォームセンター論⽂から公知データをつくる（データベース）データ創出 実験、計測 機械学習などによるマイニング、解析 計算、予測 ラボノート9データリポジトリ（データの来歴・メタ情報・オープンクローズ制御・品質保証・作者／著者／利⽤者管理）材料データプラットフォームセンター例︓論⽂からデータを取る時機械可読の論⽂XMLデータデータを使うデータベースに論⽂ データベース⼈と機械語彙・アルゴリズムの開発で、機械学習によるデータ抽出機械と⼈の連携によるデータ源の拡⼤・活⽤を広げ潜在的情報資産の発掘から新規開拓へ「つくる」データをインフォマティクス研究に「つかう」⼤量の実験データから物性値等を抽出量的価値を重視したデータ収集実験・計測データ論⽂データ学術的価値を重視したデータ収集⼤量の公知データから物性値等を抽出-200 -100 0 100 200 300 400-1000100200300400500600700 PoLyInfo TDMTm (C)Tg (C)MIのためのデータ源材料データプラットフォームセンター11Material TypeMaterial Sub CathegoryStructural FeaturesStructure Sub CathegorySpecimenCAS No. etcpurchase date (if needed)supplyerLot. No. / Product No. etc物質タイプ物質サブカテゴリー構造的特長構造サブカテゴリー試料CAS番号等購入年月日（必要なら）購入先Lot. No. / Product No. 等試料のメタデータ 計測のメタデータData originMethod CathegorySub CathegoryAnalysis fieldPurpose(free description)SpecimenMeasurement environmentEnergy Level_Transition_Structure etc. of inteMeasurement dateStandardized procedure (specified number)Instrumentation siteReference (if needed)(free description)データの起源計測法　カテゴリーサブカテゴリー分析分野目的（自由記述）試料測定環境対象準位_遷移_構造分析年月日標準手順 (特定する番号)装置設置機関参考文献（必要なら）（自由記述）合成のメタデータdate(yyyymmddhhmm)process_cathegoryprocess_techniqueProcessing EnvironmentKey Temperature (C)Instrumentation siteStandardized procedure (specifiedDescription(free)処理年月日(yyyymmddhhmm)プロセスカテゴリープロセス手法処理環境主となる処理温度装置設置機関標準手順 (特定する番号)付記事項（自由記述）データ流通のために、メタは⾃分で作るという現実あり材料データプラットフォームセンター12物性データベース計測・観察計算材料試験datadatadataデータとメタデータ＋ 最小限の語彙統制-200 -100 0 100 200 300 400-1000100200300400500600700  PoLyInfo ACS+Elsevier TDMTm (C)Tg (C)マテリアルズ・インフォマティクスデータの公開（検索と閲覧、可視化）データの出版（ダウンロードと引用）データの蓄積・管理データの活用材料名計測法プロセス構造PID/DOI分析・可視化知識化法則化データプラットフォームシステムの構築13仮想マシン＆共通アダプタによる機能の連携（マイクロサービスによる機能実現）材料計測データアノテーションデータ公開電子ラボノート 機械学習データセット生成共通アダプタ（API-FWK）スマート検索データプラットフォームシステムの構築研究データ管理データ中継来歴メタ収集14Materials Data Platform CenterData‐Driven Scienceデータ駆動型研究と共に進展するデータプラットフォームNIMS Roadmap• データポリシ/ 2018 Aug• データ管理DMP /2019• 方針と運用 / 2019-2020組織連携 – organizational collaborations材料データプラットフォームセンター15ためる、つかうプラットフォーム実現の５つ課題１．データの質だれが・いつ・どのような条件で⇒データ来歴情報を最低限のメタデータとして登録必須２．データの量機械学習やインフォマティクス⇒機械可読にためる・機械学習に使うデータサイクル３．適切な利⽤データ登録時に、利⽤ライセンスや契約⇒データを適切な条件で利⽤４．安全な環境利⽤規則⇒登録者・利⽤者は、予めの登録で⾝元確認５．データプラットフォームという研究開発の発展の場• データ形式を整えるツール、⽤語を変換する語彙などを提供• データを解析する環境を提供• 機械学習の時代に応えるデータ⽣成ツール、多様な⽤途のAPIを研究開発データリポジトリ（データの来歴・メタ情報・オープンクローズ制御・品質保証・作者／著者／利⽤者と権限管理）材料データプラットフォームセンター先⾏するSIP-MI、MI2I-DPFのユースケースや経験を活かし次世代DPFの開発へ研究・開発(R&D keywords for DPF)Materials Data Modeling, MetaSchema, JATS4R, PID, LinkedData, Voc, Ontology, RDF, GraphDB, SPARQL, Visualization, CAS, Security, Storage, Log analysis Materials Data Platform CenterAppendixMaDISシンポジウム 2019AIで加速する材料開発とデータプラットフォーム戦略 1/30