# Fileset

[物質・材料研究機構における機関リポジトリと研究者総覧の運用省力化の取り組み.pdf](https://mdr.nims.go.jp/filesets/d100a07e-121d-434c-ba53-4d5c567118fa/download)

## Creator

[田辺 浩介](https://orcid.org/0000-0002-9986-7223)

## Rights

[Creative Commons BY Attribution 4.0 International](https://creativecommons.org/licenses/by/4.0/)

## Other metadata

[物質・材料研究機構における機関リポジトリと研究者総覧の運用省力化の取り組み](https://mdr.nims.go.jp/datasets/f8520ae2-5328-471f-9fe3-21008d84743a)

## Fulltext

NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM物質・材料研究機構における機関リポジトリと研究者総覧の運用省力化の取り組み田辺浩介 TANABE.Kosuke@nims.go.jp物質・材料研究機構技術開発・共用部門 材料データプラットフォーム データ基盤ユニット 主幹エンジニアhttps://orcid.org/0000-0002-9986-72232024年7月4日 INFOPRO2024mailto:TANABE.Kosuke@nims.go.jphttps://orcid.org/0000-0002-9986-7223NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMMaterials Data Repository (MDR)•物質・材料研究機構(NIMS)の運用するデータリポジトリ• https://mdr.nims.go.jp• 2020年6月から運用開始•約1,000件の論文・約12,800件のデータセットを収録2https://mdr.nims.go.jpNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMリポジトリ運用で手間がかかること•リポジトリの登録対象となる（研究者に登録を依頼する）論文の特定•論文ファイルの登録•メタデータの入力・修正•著作権ポリシー・ライセンス・エンバーゴ期間の調査•登録のお礼メールの送信•今日はそれぞれの作業での運用省力化の取り組みについてお話しします3NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMリポジトリの登録対象となる論文の特定→ ORCIDとScopusを使用NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM研究者のORCID番号の収集1. 研究者のORCID番号を集める2. 集めたORCID番号を用いて、ORCIDを検索し、その研究者が書いた論文のDOIを取得3. ORCIDとScopus Author IDが紐付いている場合は、それを用いてScopusを検索し、対象の論文のDOIを取得• 2・3の作業はWebAPIを用いて自動化4. 研究者ごとに論文DOIの一覧を作成5NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMNIMSでのORCID番号の収集• NIMSでは「研究者総覧SAMURAI」(https://samurai.nims.go.jp) に、研究者自身でORCID番号を登録してもらっている• ORCID番号を登録しないと、SAMURAIに自分の情報が表示されない仕組みにしている6https://samurai.nims.go.jp/NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM研究者総覧SAMURAI7NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM研究者のORCID番号の集め方機構メールアカウントでログイン研究者ORCIDのアカウントでログインORCID番号をプロフィール情報に紐付けSAMURAI上で、機構内の情報（機構メールアカウント）とORCID番号が紐付けられる8NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM研究者の業績情報の取得論文のDOI一覧論文情報を登録論文情報を自動登録(Auto Update)Scopus Author IDでScopusの論文を検索ORCIDとScopus Author IDを紐付け研究者出版社Scopus9NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMScopus Author ID• Scopusで付与している著者識別子•研究者はORCID番号に対して、Scopus Author IDを自分で紐付けられるようになっている• Scopus APIで取得した書誌情報には、著者のScopus Author IDが含まれており、これを用いて名寄せを行っている10NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMプログラムを用いてORCID上の業績一覧を取得するORCID上の業績情報をTSVファイルに出力する例11NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM論文ファイルの登録→ 研究者向けの登録画面を用意NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM論文ファイルの登録•「MDR登録システム」という内部アプリケーションを作成•研究者自身がMDR登録システムにログインし、WebフォームからMDRに登録するファイルをアップロードできる◦ ログインは各自の機構内メールアカウント• 研究者本人だけでなく、研究者が指定したユーザによる代理登録も可能•入力が必要なメタデータは、キーワードと概要のみ•研究者に自分でタイトルや著者名を入れさせたところで間違いだらけなので、最初から入力を求めていない13NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMメタデータの入力・修正→ DOIとCrossref・JaLCを使用NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMメタデータの入力・修正• DOIを用いて自動入力◦ Crossref・JaLCから書誌情報をインポートする◦ 実際には、書誌情報は機構のSAMURAI に保存してあり、これを再利用している15NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMMDR登録システムでのDOIによる論文登録DOIや機構内の業績番号を用いてインポート16NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMDOIから論文の書誌情報を取得17•MDR登録システムは、DOIを用いてSAMURAI上の書誌情報を自動的に取得し、それらを登録フォームに入力するタイトルや著者情報などをインポートDOIを用いて書誌情報を自動的に検索研究者MDR登録システムNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMMDR登録システムの論文登録フォームタイトル・著者名などはDOIから自動入力研究者はファイルのアップロードと一部のメタデータ項目（キーワードなど）を入力するだけ18NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMSAMURAI上に保存されている書誌情報論文のDOI著者のORCID番号19NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM著作権ポリシー・エンバーゴ期間の調査→ 論文のDOI・論文の掲載誌のISSNと Sherpa Romeo・SCPJ/日本の学協会の 著作権ポリシー確認ツール・Unpaywallを使用NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM著作権ポリシー・エンバーゴ期間の調査1. DOIを用いて、論文の掲載誌のISSNを取得2. ISSNを用いて、Sherpa RomeoやSCPJを検索3. Sherpa Romeoにエンバーゴ期間の情報があった場合、それをメタデータ項目に入力4. その後リポジトリ担当者が出版社のサイトでエンバーゴ期間を確認21NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMSherpa Romeo• https://www.sherpa.ac.uk/romeo/•ジャーナルの著作権ポリシーを集めたデータベース•WebAPIも提供•和文誌の情報は（おそらく）収録されていない22https://www.sherpa.ac.uk/romeo/NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMSherpa RomeoのWebAPIリポジトリ掲載のエンバーゴ期間や掲載条件を取得できる23NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM日本の学協会の著作権ポリシー確認ツール• https://app.lib.shimane-u.ac.jp/policy_checker/scpj.php•島根大学附属図書館の提供するサービス• JPCOARの提供する「学協会著作権ポリシーデータベース」(SCPJ)の検索インターフェース• ISSNをURLに指定するだけで検索結果を呼び出せる。WebAPIも提供24https://app.lib.shimane-u.ac.jp/policy_checker/scpj.phpNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMUnpaywall• https://unpaywall.org• DOIをもとに、その論文がオープンアクセスかどうかの情報を提供するサービス•Webブラウザの拡張機能だけでなく、WebAPIも提供•一定数の呼び出しであれば無料で利用可能• 2024年6月現在、JaLC DOIの情報は未収録（収録作業中）25https://unpaywall.orgNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMライセンスの調査1. DOIを用いて、Unpaywallを検索2. Unpaywallの検索結果から、論文のライセンス情報を取得3. MDR担当者が登録されたファイルを確認する• ライセンスがCC(Creative Commons)であれば、出版社版が登録されていてもそのまま公開する• CCでなければ、MDR担当者が出版社のWebサイトで著作権ポリシーやエンバーゴ期間を調査し、メタデータ項目に追記する4. 登録されたファイルが出版社の著作権ポリシーに合致しない場合、登録者にファイルの差し替えを依頼する• ポリシー調査やファイルの差し替え依頼の記録はGitLabで行い、MDR担当者の間で共有できるようにする26NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMGitLab27• https://gitlab.com•ソースコード管理用ソフトウェア•商用ライセンスとオープンソースライセンスの両方で提供• GitHubと同様の環境をオンプレミス環境で構築できる•ソースコードだけでなく、イシュー（課題）管理の機能もある•MDRではGitLabのイシュー管理機能をMDR登録作業の管理に使用しているhttps://gitlab.comNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMGitLabのイシュー管理機能による登録作業管理28NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMGitLabのイシュー管理機能による登録作業管理29著作権ポリシーの調査記録をイシューに記入NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMSherpa Romeo・SCPJ・Unpaywallの検索の自動化ボットが各データベースを検索し、検索結果をGitLabに自動的に記入Sherpa Romeo・SCPJの検索結果Unpaywallの検索結果30NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM登録のお礼メールの送信→ GitLab APIとメール送信用スクリプトを使用NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM登録お礼メールの送信MDRでの公開完了時に、登録者にメールを自動的に送信する32NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMシステムの全体像SCPJScopusMDR登録システム書誌情報著者情報・論文DOI一覧著者情報著作権ポリシー・ライセンス情報著者情報・論文DOI一覧コメント記入 データ公開MDR登録システムが各サービスのWebAPIを呼び出す形になっている33NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM登録業務の省力化の成果NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMリポジトリ運用で手間がかかること•登録対象の論文の特定 → 自動化•論文ファイルの登録 → 作業量削減•メタデータの入力・修正 → 自動化•著作権ポリシー・ライセンス・エンバーゴ期間の調査 → 作業量削減•登録のお礼メールの送信 → 自動化35NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM省力化の取り組みの成果36• 2023年に機構の業績として登録された論文のうち、MDRに登録されたのは約4%•これが2024年4月現在、約30%にまで増加• NIMSでは2024年より論文のMDR登録が事実上必須化されており、省力化の取り組みだけで登録数の増加が実現できたわけではない•しかし、登録数の増加への対応は、省力化なしではとうてい行えないNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMまだリポジトリ担当者が行わなければならないこと•登録されたファイルが出版社版か著者版かの判別•著作権ポリシー・エンバーゴ期間の確認•上記に伴う研究者とのやりとり• 出版社版を載せられない論文に対するファイルの差し替え依頼がほとんど• 多くの研究者は出版社版の登録を希望する37NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM今後の課題（2024年中に実施予定）38•研究者へのMDR登録依頼メール送信の自動化• Unpaywallの検索結果を用いて、研究者の用いる登録画面に出版社版の登録の可否を表示する• CCライセンスであれば「出版社版登録可」と表示する• 研究者にジャーナルごとの出版社版登録の可否を調べさせるのは無理だし、そもそもそのような業務を研究者に押し付けるべきではないNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM今後の課題（長期課題）39•論文付随データへの対応• 現在のNIMSの運用では、登録を求めているのは論文のみ•「公的資金による研究データの管理・利活用に関する基本的な考え方」の共通メタデータ項目の自動入力• 特に研究資金の体系的番号とe-Rad番号NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMまとめNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMPID（Persistent Identifier、永続的識別子）の重要性•小規模なシステム開発体制で省力化が実現できたのは、DOIやORCIDなどのPID（永続的識別子）と、それらを用いてWebAPIで取得できる機械可読なメタデータがあってこそ•リポジトリで登録する資料に、どのようなPIDが付与されているのかを調べてみよう•付与されているPIDで、どのようなWebAPIが使えるのか、どのようなメタデータが取得できるのかを調べてみよう• CrossrefやJaLC、Unpaywallは、WebブラウザとDOIだけで試せるのでおすすめ。以下の :doi を好きなDOIに置き換えてアクセスしてみよう• https://api.crossref.org/works/:doi• https://api.japanlinkcenter.org/dois/:doi• https://api.unpaywall.org/v2/:doi41NATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMPIDによって自動的につながるサービスとデータSCPJScopusMDR登録システム書誌情報著者情報・論文DOI一覧著者情報著作権ポリシー・ライセンス情報著者情報・論文DOI一覧コメント記入 データ公開42ORCID・DOIなどのPID（永続的識別子）があることで、サービスとデータが自動的につながるNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORM今回使用したWebAPI• ORCID• 研究者の業績情報の取得。無料だが、非公開情報の取得はORCID機関会員のみ• Crossref / JaLC• DOIやORCIDによる書誌情報の取得。無料• Scopus• DOIやORCIDによる書誌情報の取得。無料版は制限あり、要APIキー取得• Sherpa Romeo• ISSNやジャーナル名による著作権ポリシー情報の取得。無料、要APIキー取得• Unpaywall• DOIによるオープンアクセス情報の取得。無料• GitLab• 登録作業の情報の読み込みと書き込み。無料版はユーザ数制限あり43https://info.orcid.org/documentation/api-tutorials/api-tutorial-read-data-on-a-record/https://api.crossref.org/swagger-ui/index.htmlhttps://api.japanlinkcenter.org/api-docs/index.htmlhttps://dev.elsevier.com/sc_api_spec.htmlhttps://www.sherpa.ac.uk/api/https://unpaywall.org/products/apihttps://docs.gitlab.com/ee/api/api_resources.htmlNATIONAL INSTITUTE FOR MATERIALS SCIENCE   |    MATERIALS DATA PLATFORMTANABE.Kosuke@nims.go.jp感想・質問・ご意見などお気軽にお寄せください！ スライド 1: 物質・材料研究機構における 機関リポジトリと研究者総覧の 運用省力化の取り組み スライド 2: Materials Data Repository (MDR) スライド 3: リポジトリ運用で手間がかかること スライド 4: リポジトリの登録対象となる論文の特定 スライド 5: 研究者のORCID番号の収集 スライド 6: NIMSでのORCID番号の収集 スライド 7: 研究者総覧SAMURAI スライド 8: 研究者のORCID番号の集め方 スライド 9: 研究者の業績情報の取得 スライド 10: Scopus Author ID スライド 11 スライド 12: 論文ファイルの登録 スライド 13: 論文ファイルの登録 スライド 14: メタデータの入力・修正 スライド 15: メタデータの入力・修正 スライド 16: MDR登録システムでのDOIによる論文登録 スライド 17: DOIから論文の書誌情報を取得 スライド 18 スライド 19: SAMURAI上に保存されている書誌情報 スライド 20: 著作権ポリシー・エンバーゴ期間の調査 スライド 21: 著作権ポリシー・エンバーゴ期間の調査 スライド 22: Sherpa Romeo スライド 23: Sherpa RomeoのWebAPI スライド 24: 日本の学協会の著作権ポリシー確認ツール スライド 25: Unpaywall スライド 26: ライセンスの調査 スライド 27: GitLab スライド 28 スライド 29 スライド 30: Sherpa Romeo・SCPJ・Unpaywallの検索の自動化 スライド 31: 登録のお礼メールの送信 スライド 32: 登録お礼メールの送信 スライド 33: システムの全体像 スライド 34: 登録業務の省力化の成果 スライド 35: リポジトリ運用で手間がかかること スライド 36: 省力化の取り組みの成果 スライド 37: まだリポジトリ担当者が行わなければならないこと スライド 38: 今後の課題（2024年中に実施予定） スライド 39: 今後の課題（長期課題） スライド 40: まとめ スライド 41: PID（Persistent Identifier、永続的識別子）の重要性 スライド 42: PIDによって自動的につながるサービスとデータ スライド 43: 今回使用したWebAPI スライド 44: TANABE.Kosuke@nims.go.jp