●研究の一手法として、学会や出版社が発行するオンラインジャーナルから、出版論文の本文テキストやデータを機械的にダウンロード (Text and Data Mining, TDM) をする時、「自分の研究用途」とは、どこまでと考えればよいでしょうか。計画当時よりTDM の有用性があり、民間から利用希望があるまでに発展すれば、そこから新しい科学技術に繋がる可能性があります。そうした時 :
Q1. 研究テーマに関する複数のジャーナルから、本文(XML, TEXT), 図表(JPEG) をTDM し、自分が管理するサーバに保存、言語処理やデータ抽出、あるいは機械学習のツールやアプリケーションを使って新たな体系として取り出した結果を、自分の成果物として他機関や他国の同僚と共用して良いでしょうか?
Q2. Q1の結果を、有償で提供して良いでしょうか?
Q3. Q1と類似の研究を他の研究者や研究機関が行っている場合に、それらの結果を持ち寄り、皆で使えるようなウェブプラットフォーム化する時、一次出版者 (ジャーナル発行者や著者) に対して許諾を求めたり、ロイヤルティの支払いが必要になるでしょうか? (大量のTDM をすれば、個々の論文やジャーナルの利用権利毎に許諾を求めることが実際的ではないので、実際にはどうすればよいでしょうか?)
Q4. Q3のような情報プラットフォームが多くの人に支持され、持続的にデータを更新するための機械学習やAI の開発費として、若干の使用料を研究者や企業に課金をして支援をして欲しいと考える時、一次出版者に対して何らかの還元の義務を負う可能性はあるでしょうか?私の研究成果としての財産権が守られる範囲は、どこまでなのでしょうか?
●追加質問「データキュレーションに関して」
Q5. 実験データのうち、著作権のない自然科学データと見なせるデータはどのようなデータでしょうか?
また、計算シミュレーションによるデータには著作権が発生するのでしょうか?
Q6. オープンアクセスではない論文に掲載されたグラフから、元の数値データを抜き出して、引用元を示してデータベースに公開した場合、著作権の侵害になりますか?
元のグラフと軸の取り方を同じにした場合のみ、著作権の侵害になりますか?
Q7. 上記の数値データの抜き出しが、2次元マップ型のグラフにも適用可能だと考えた場合、電子顕微鏡像などの2次元画像についても強度と空間内距離を数値化して、自然科学データとして利用することはできるのでしょうか?
Q8. 世界の物性データベース(MatNavi, Materials Project, NoMaD)では、非オープンアクセス論文由来のデータへのアクセスにメンバー登録とログインを必要としています。
この仕組みにより、「不特定多数への公開」と見なされる事態は回避できるのでしょうか?
Q9. 自分の研究機関で得た論文のフルテキストを知り合いの研究者に渡すことを、Elsevierは寛容に認めてくれています。一方、ほかの出版社では規約に書いていないのですが、どのような扱いになっているのでしょうか?