# Fileset

[20190528_JOSS_V1.0[抜粋].pdf](https://mdr.nims.go.jp/filesets/58ddb30e-6378-40c6-98fe-5d20cf31f2f9/download)

## Creator

[菊地 伸治](https://orcid.org/0000-0001-8069-9656)

## Rights



## Other metadata

[物質・材料研究機構における研究データ管理に向けた取り組み](https://mdr.nims.go.jp/datasets/30d6ab87-6065-4ccb-b262-c5cbf49a0d86)

## Fulltext

基本設計書-補足説明書その１-V1.0.0国立研究開発法人 物質・材料研究機構材料データプラットフォームセンター菊地伸治物質・材料研究機構における研究データ管理に向けた取り組みThe current approach for Research Data Management at NIMS背 景➢ 「第四の科学手法」の提唱から既に10年を経過✓ The Fourth Paradigm: Data-Intensive Scientific Discovery✓ [出典]T.Hey, S.Tansley and K.Tolle Published by Microsoft Research, October 2009, ISBN:978-0-9825442-0-4✓ https://www.microsoft.com/en-us/research/publication/fourth-paradigm-data-intensive-scientific-discovery/?from=http%3A%2F%2Fresearch.microsoft.com%2Fen-us%2Fcollaboration%2Ffourthparadigm%2F✓ クラウドコンピューティング、センサーNW、機械学習技術が定着・高度化➢ 材料科学分野でも世界規模でMaterial Informaticsに関する取り組みが進行中✓ 蓄積された膨大な実験データ, 計算機能力の向上により算出可能となった膨大な計算データを入力として統計学, パターン認識, AI等のデータ解析技法を用いてプロセスと特性間, 異なる特性間に成り立つ法則性を抽出・発見, 予想を可能とすることで, 新たな材料開発を加速すること。✓ [出典]✓ 知京豊裕, ‘マテリアルインフォーマティクスの現状と課題～海外の動向と日本の挑戦’ ,情報知識学会誌, 2017 Vol.27, No.4, Pp.297-304, 2017.✓ 上島伸文, 及川勝成‘技術解説～計算材料科学・工学の最新動向’, 電気製鋼, 第87巻1号, 2016年, Pp.21-26.➢ 当機構でも、材料科学に纏わる各種データを「つくる」「ためる」「使う」「公開する」という4機能を統合したMaterial Informatics環境実現に向けて公共財としての「材料データプラットフォーム」を整備中2https://www.microsoft.com/en-us/research/publication/fourth-paradigm-data-intensive-scientific-discovery/?from=http%3A%2F%2Fresearch.microsoft.com%2Fen-us%2Fcollaboration%2Ffourthparadigm%2FMatNaviCore System構造物性実験装置電子ラボノート既存データベースためる 使う公知情報電子物性 光物性熱物性材料名データ駆動材料特性縦断横断利用法 アクセス 学問 応用 形式横断利用 ランダム検索 多識 電子カルテ DB縦断利用 統合・記述 体系 インフォマティクス DS材料選択物性選択大型実験施設特性記述・モデル化リポジトリデータ一覧インフォマティクスシステムが提供する価値から見た要求機能3Vocabulary Ontology Management ServerWikibase, MediawikiApplication Server/DBMSDumper/Exporter BatchServersPortal ServerData Receiving/Sending ServerResearch Data Management(RDM) Server(Enhanced OSF Server)Material Data Repository(MDR) Server for Internal Uses Material Data Repository(MDR) Server for Data DisclosureMaster Data management ServerStoragesRDM Storage AreaMessage ReceiverApplication Server in Fedra4Data Delivery Manager BatchAPI ProviderMaster Data Importer BatchMetadata Importer BatchApplication Server/DBMS in OSFMessage Receiver BatchMessage Receiver BatchApplication Server in HyraxRDF Dumper BatchSecurity Check BatchData Delivery SenderApplication ServerSub-System (Data Collection System) ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System Server(Machine Learning Dataset Generator)Application ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application Components PID ManagementIoT devices Lab Note applicationApplication ServerInstruments, facilities and Assets ManagementHuman Resource OrganizationManagementDumper/Exporter BatchApplication ComponentsCAS ServerTicket ServerApplication Server/DBMSAgents for authenticationStored Research Raw DatasetDelivered Research Raw Dataset MDR Storage AreaLDAP ServersLDAP RDF ProcessorApplication ServerSPARQL Endpoint 配置図による全体アーキテクチャ生成する(つくる）→ 管理する(ためる)→ 公開する業務系ワークフロー4Vocabulary Ontology Management ServerWikibase, MediawikiApplication Server/DBMSDumper/Exporter BatchServersPortal ServerData Receiving/Sending ServerResearch Data Management(RDM) Server(Enhanced OSF Server)Material Data Repository(MDR) Server for Internal Uses Material Data Repository(MDR) Server for Data DisclosureMaster Data management ServerStoragesRDM Storage AreaMessage ReceiverApplication Server in Fedra4Data Delivery Manager BatchAPI ProviderMaster Data Importer BatchMetadata Importer BatchApplication Server/DBMS in OSFMessage Receiver BatchMessage Receiver BatchApplication Server in HyraxRDF Dumper BatchSecurity Check BatchData Delivery SenderApplication ServerSub-System (Data Collection System) ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System Server(Machine Learning Dataset Generator)Application ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application Components PID ManagementIoT devices Lab Note applicationApplication ServerInstruments, facilities and Assets ManagementHuman Resource OrganizationManagementDumper/Exporter BatchApplication ComponentsCAS ServerTicket ServerApplication Server/DBMSAgents for authenticationStored Research Raw DatasetDelivered Research Raw Dataset MDR Storage AreaLDAP ServersLDAP RDF ProcessorApplication ServerSPARQL Endpoint 配置図による全体アーキテクチャ5利活用する(つかう)Vocabulary Ontology Management ServerWikibase, MediawikiApplication Server/DBMSDumper/Exporter BatchServersPortal ServerData Receiving/Sending ServerResearch Data Management(RDM) Server(Enhanced OSF Server)Material Data Repository(MDR) Server for Internal Uses Material Data Repository(MDR) Server for Data DisclosureMaster Data management ServerStoragesRDM Storage AreaMessage ReceiverApplication Server in Fedra4Data Delivery Manager BatchAPI ProviderMaster Data Importer BatchMetadata Importer BatchApplication Server/DBMS in OSFMessage Receiver BatchMessage Receiver BatchApplication Server in HyraxRDF Dumper BatchSecurity Check BatchData Delivery SenderApplication ServerSub-System (Data Collection System) ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System Server(Machine Learning Dataset Generator)Application ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application Components PID ManagementIoT devices Lab Note applicationApplication ServerInstruments, facilities and Assets ManagementHuman Resource OrganizationManagementDumper/Exporter BatchApplication ComponentsCAS ServerTicket ServerApplication Server/DBMSAgents for authenticationStored Research Raw DatasetDelivered Research Raw Dataset MDR Storage AreaLDAP ServersLDAP RDF ProcessorApplication ServerSPARQL Endpoint 配置図による全体アーキテクチャ6➢ 構築コストの大幅圧縮を理由にOSSを多用 → 設計工程の不安定さも招く必須共通メタ(更に上位を含む)計測主要パラメータ(計測)装置出力パラメータ(計測)情報付き任意データ(計測)ヘッダ部物質材料主要パラメータ(物質・材料)装置出力パラメータ(物質・材料)情報付き任意データ(物質・材料)ヘッダ部特性主要パラメータ(特性)装置出力パラメータ(特性)情報付き任意データ(特性)ヘッダ部合成・プロセス主要パラメータ(合成・プロセス)装置出力パラメータ(合成・プロセス)情報付き任意データ(合成・プロセス)ヘッダ部計算主要パラメータ(計算)装置出力パラメータ(計算)情報付き任意データ(計算)ヘッダ部任意画像・バイナリデータ任意画像・バイナリデータ…任意画像・バイナリデータ任意画像・バイナリデータ…任意画像・バイナリデータ任意画像・バイナリデータ…任意画像・バイナリデータ任意画像・バイナリデータ…任意画像・バイナリデータ任意画像・バイナリデータ…計測メタ物質材料(試料)メタ特性メタ 合成・プロセスメタ 計算メタサムネイル画像アーカイバで統合・圧縮の後、Base64でエンコード・暗号化される。その後、全体でpidを付番し、署名付与をしてメタデータ(Json)と伴に１メッセージで登録を実施する。名称：work「計測」相当の下位ディレクトリ: (名称：characterization-methods)data-1:名称任意(形式：png,gif)data-2:名称任意(形式：txt)… 個数は任意(最大255)「物質材料(資料)」相当の下位ディレクトリ: (名称：specimen-types)data-1:名称任意(形式：png,gif)data-2:名称任意(形式：txt)… 個数は任意(最大255)「特性」相当の下位ディレクトリ: (名称：properties-addressed)「合成・プロセス」相当の下位ディレクトリ: (名称：synthesis-processing)「計算」相当の下位ディレクトリ: (名称：computational-methods)「Tool」相当の下位ディレクトリ: (名称：tools)上記以外の下位ディレクトリ: (名称：others)※このディレクトリ構造配下は以下の制約を除き、自由に定義可能とする。データのモデル化と流通形式7Vocabulary Ontology Management ServerWikibase, MediawikiApplication Server/DBMSDumper/Exporter BatchServersPortal ServerData Receiving/Sending ServerResearch Data Management(RDM) Server(Enhanced OSF Server)Material Data Repository(MDR) Server for Internal Uses Material Data Repository(MDR) Server for Data DisclosureMaster Data management ServerStoragesRDM Storage AreaMessage ReceiverApplication Server in Fedra4Data Delivery Manager BatchAPI ProviderMaster Data Importer BatchMetadata Importer BatchApplication Server/DBMS in OSFMessage Receiver BatchMessage Receiver BatchApplication Server in HyraxRDF Dumper BatchSecurity Check BatchData Delivery SenderApplication ServerSub-System (Data Collection System) ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System Server(Machine Learning Dataset Generator)Application ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application ComponentsSub-System ServerApplication ServerDockerAPI-FWK(Outbound)API-FWK(Inbound)Application Components PID ManagementIoT devices Lab Note applicationApplication ServerInstruments, facilities and Assets ManagementHuman Resource OrganizationManagementDumper/Exporter BatchApplication ComponentsCAS ServerTicket ServerApplication Server/DBMSAgents for authenticationStored Research Raw DatasetDelivered Research Raw Dataset MDR Storage AreaLDAP ServersLDAP RDF ProcessorApplication ServerSPARQL Endpoint 配置図による全体アーキテクチャ➢ PID(Persistent Identifier): Master Data Managementの一環、試料・装置等に総背番号化、データの意味的統合時のGlueの役割➢ API-FWKは後述8暫定評価：他プラットフォームとの比較による位置付け[出典] C.S. Liew, et al. ‘Scientific Workflows: Moving Across Paradigms’.  ACM Computing Surveys, Vol. 49, No. 4, Article 66, 2016.➢ 役割的には前工程が中心、但し、意味的な統合迄の実現を指向➢ 逓増的に基本設計を進化させており「マイクロサービス」の性格がより高まっている✓ 構築上はネガティブな面も含むが、「進化的アーキテクチャ」の概念を取り込みつつあるScope of our platform[出典] N.Ford, R.Parsons and P.Kua. ‘Building Evolutionary Architectures – Support Constant Change - O’Reilly Media, Inc, 20179QueryReadPreprocessGenerateFeaturesSelectFeaturesSplitDataExtractModelEvaluateModelDBMSFileSystemmodelresultstraining settesting setData Integration Data Preparation Data Mining学域毎のAd hoc性学域毎の研究エコ系の構築研究エコ系に基づく縦割りの開発リファレンスアーキテクチャ定義への障壁クラウドビジネス環境の持つ非標準指向クラウドビジネス環境の持つ新たなサービス化に対するデマンド類似機能/手法の多重化開発データ巨大化コンポーネント類のブラックボックス化データ/解析結果品質の確保が困難な点データ管理技術/手法の不在、未成熟最新技術の適用/応用技術/データの多様化新しい計測方法/知見獲得習熟上の課題課題A 課題B【凡例】課題Aは課題Bに依存➢ 有向アークを集めるノード、有向アークの終着ノードが、真因の可能性が高い➢ 閉じたループを作るノード群は構造的な問題であり、解決が難しい暫定評価：Scientific Workflowにおける問題構造[出典] 菊地伸治,細野繁,'Scientific Workflowの動向について' 信学技報, vol. 118, no. 72, SC2018-5, pp. 27-31, 2018年6月.10暫定評価と結論➢ 前課題構造で見られる下記課題群に対する見解は以下の通り。 特に「マイクロサービス」指向を含めた「進化的アーキテクチャ」への展望により、部分的にせよ潜在的には対応し得ると考える➢ 技術/データの多様化：流通管理と解析部を分離・RDF化、管理機構は標準化➢ クラウドビジネス環境の持つ非標準指向：未対応事項、OSF-Waterbutler API採用等で対応➢ 意味的な統合迄の実現を指向しており、その意味で「高付加価値科学データ創出を指向した研究データ管理プラットフォーム」と定義し得る。➢ 更にリファレンスモデルに昇華させるには、「進化の取り込みやすさ」を考慮したブラッシュアップも必要。11Thank  you very much  for your attention.