2020/05/12

論文の二重投稿がなぜいけないのか、実はよくわからない

二年ほど前にツイート したことがあったが、まだ論文の二重投稿がなぜいけないのか、感覚的にわからない。

原則や表面的な理由は知っている。投稿された論文を審査するには、編集者と査読者の大きな労力が必要。複数のジャーナルに同時に投稿することは、出版に携わる人のリソースを浪費してしまうことになる。実に「正しい」理由である。

しかし、私は基本的に査読懐疑派であるので、現在の査読システムでは研究者の時間というリソースが浪費されている場合が多いという視点で見てしまう。数週間待たされたあとで「scope に合わない」と editor kick とかありえないし、半年かけて査読コメントが 3 行でアクセプトというのも最近あった。

実際、アカデミックポジションやグラントには何件も応募するわけで(一般の就活でも)、既にポジションがあっても、よいサラリーをくれる大学からオファーをもらって待遇改善の交渉をするなんてのもアメリカの大学ではよくある話。研究大学じゃなくてもまかり通ってる。なぜ論文で同じことをやってはいけないのだろう?

これは結局、ポジションやグラントは論文よりも大事なので、慣例的にやって良いということになってるに過ぎないのだろう。この問題に対する Q&A なんかでは、 そのように説明しないとフェアじゃない。

コロナでみんなが家にいるようになってるので、ゲーム機の値段が上がっている。ニンテンドースイッチを買おうかと思って調べてみたら、定価の倍くらい出さないと手に入らないようだ。マスクの転売は禁止なのに、スイッチの転売は野放し。これも結局「マスクはスイッチよりも大事」という相対的価値で良いかダメかが決まっている。

これを説明するとき「転売はダメ」と説明するのではなく、「転売は下品な行為であるものの、一般に許容されている。しかしマスクの場合には社会的影響が大きいと判断されるので法的規制をする」と説明をしないと、どこかすっきりしない感が残る。論文の例と同じだね。

2019/06/08

論文に仮説は必要か?

論文を書く際にしばしば求められる「仮説」というのがどうも気に入らない。

いや、別に仮説検証型の研究に文句を言うつもりはない。どんどんやってほしい。気に入らないのは、仮説検証型というのが研究の唯一のスタイルだと思い込み、「仮説は?」とか聞いてくる輩だ。彼らは、「仮説」が明確に提示されていないと満足しない。

理論武装のため、仮説に関係するトピック集めたページを作りたい。このページは第一弾。いずれ UB3 の論文関係のセクションに入れようと思う。

セクション1
仮説検証型でない研究には、どんなものがあるのか?

仮説生成型、または仮説探索型という言葉がある。
https://kenkyustyle.blogspot.com/2017/08/blog-post.html
https://科研費.com/hypothesis-making-proving/

また、仮説のある research は英語だと hypothesis-driven であり、これに対して data-driven という単語がある。PLoS Biol の author guideline には、data-driven research もウェルカムと書いてある。


セクション2: 実例
私が考える「仮説の不要な研究」は、例えば複数のサンプルを使った次世代シークエンスなどの big data があって、そこから相関して変化しているものをスクリーニングするようなものである。具体例を想像してみると、

「カエルの発生段階別 NGS データで、足が生えてきたら発現が変化する遺伝子を探す。足の発生に関わっている可能性がある。」

この論文のイントロは、以下のようになるだろう。

・カエルは、発生段階の初期には足がない(オタマジャクシ)
・足の発生を制御する遺伝子は同定されていない
・NGS スクリーニングの有効性、カエルの他の遺伝子の例など
・そこで本研究では・・・

ここに無理矢理仮説をくっつけるとすると、以下のようなパターンが考えられる。

1. 足の発生の前後で発現が変化している遺伝子が、発生に関わっているという仮説を検証した。

これだと、スクリーニングした遺伝子が足の発生に関わっているということまで論文内で示さなければならなくなる。


2. 足の発生の前後で、何らかの遺伝子発現が変化しているという仮説を検証した。

仮説がブロードすぎて、意味がないように思う。


3. 実際にAという遺伝子がとれたら、Aを含む遺伝子ネットワークBについて「Bが発生に重要なので、この系が関わっているものと仮説を立てた」とする。

で、実際にAの発現が変化していたので、「仮説は支持された」ということになる。これが、ツイッターで一瞬話題になったHARKing (hypothesizing after the results are know) というやつである。ちなみに、HARKing という言葉で出てくる仮説は、このような論文のストーリー上の仮説を指す場合と、統計検定における帰無仮説を指す場合があるようである。かなり話が違ってくるので、HARKingを議論する際は注意したい。

実際のところ、無理矢理仮説をくっつける場合には、3が一番よく行われているように思う。しかし、1-3のいずれもあまり意味がない。

「論文には仮説が必須」「Research questionがない論文は無意味」というのは、特定の分野では説得力のあるルールかもしれないが、ケースバイケースであると考えたい。

追記:
HARKingに関しての話なら、私は論文のストーリー上の仮説を後から作るのは、まあ仕方ない場合もあるという立場である。実際、「Xを想定していたけどYになりました。その解釈は・・・」という論文で、イントロにXのことばっかり書いてあったら非常に読みにくい論文である。

論文のストーリー記述方法としてはまあありで、複数の論文を俯瞰したときに、分野として再現性があれば良いのではないかと思う。

これを研究不正としてしまうと、仮説が著者の頭にない段階(上記のカエル論文のようなケース)で、Reviewerに「仮説は?」と聞かれた場合に、withdrawしなければならなくなる。

2019/05/07

K to 12 (または K-12) の意味: 何を表しているのか?

K-12のようにハイフンでつなぐ場合は、K through twelve と読む。

K は、アメリカの幼稚園 kindergarten の K である。これはドイツ語の「子供 kinder」と「庭 garten」に由来するので、garDen ではなく garTen であることに注意。

12 は、高校卒業までの 12 年間を示す。アメリカでは、小中高の年数は州によって異なっているが、

・小学校 elementary school: 5 年間
・中学校 middle school: 3 年間
・高校 high school: 4 年間

という5・3・4制が主流で、トータル 12 年となる。基本的に K から高校までが義務教育なので、一般に K-12 は義務教育期間を指す 言葉として使われる。

K-12 teachers という表現もある。


参考:
1. アメリカの学校での学年・年齢について知りたい人はこちらへ.

2018/09/17

つける? つけない? PhDと書く場合のピリオドとスペース

前から悩ましく思っていたので、この際にちょっと調べてみた。

Doctor of Philosophy の略であるから、原則的にはピリオドがつき、かつ 2 つの単語として認識されるべきである。つまり "Ph. D." だ。

ただし、これは字面的にあまりよろしくない。略号は、それが広く受け入れられているならばピリオドやスペースを省くことも可能である。たとえば DNA。これは deoxyribonucleic acid なので、D. N. A. であり、昔の文献ではこう書いている例もあるが、現在は DNA が普通だろう。

cm (centimeters), mg (milligrams) など、他にも例はたくさんある。Ph. D. も同様で、PhD と書いた方がすっきりする。

よって、この PhD という書き方がどの程度広く受け入れられているかというのがポイント。

The Chicago Manual of Style (CMOS) という英文スタイルについてのマニュアルがあり、ここでは次のように定められている。

Use no periods with abbreviations that appear in full capitals, whether two letters or more and even if lowercase letters appear within the abbreviation: VP, CEO, MA, MD, PhD, UK, US, NY, IL.

つまり、このマニュアルでは「全部大文字の場合、基本的にピリオドなし(それに伴い、たぶんスペースもなし)」と定めている。これを根拠として、現状では PhD とするのが妥当と思える。


ただし、イギリスでは、大学によって D.Phil と表記する場合もあるようだ。このあたりは多様性があってもよいと思う。

2018/06/23

食品科学でよく使われる mg% という単位

見慣れない単位だけど、どうやら試料 100 g 中に含まれる量を mg 単位で表したものらしい。つまり、10 mg% なら食品 100 g 中に 10 mg 入っているということ。

食品科学など歴史の長い分野では、こういう変な単位が残っていることがある。たとえば血糖値は、いまだに mg/dL で表されることがある。デシリットルなんて、小学校以来使わない単位だと思う。