2019/06/08

論文に仮説は必要か?

論文を書く際にしばしば求められる「仮説」というのがどうも気に入らない。

いや、別に仮説検証型の研究に文句を言うつもりはない。どんどんやってほしい。気に入らないのは、仮説検証型というのが研究の唯一のスタイルだと思い込み、「仮説は?」とか聞いてくる輩だ。彼らは、「仮説」が明確に提示されていないと満足しない。

理論武装のため、仮説に関係するトピック集めたページを作りたい。このページは第一弾。いずれ UB3 の論文関係のセクションに入れようと思う。

セクション1
仮説検証型でない研究には、どんなものがあるのか?

仮説生成型、または仮説探索型という言葉がある。
https://kenkyustyle.blogspot.com/2017/08/blog-post.html
https://科研費.com/hypothesis-making-proving/

また、仮説のある research は英語だと hypothesis-driven であり、これに対して data-driven という単語がある。PLoS Biol の author guideline には、data-driven research もウェルカムと書いてある。


セクション2: 実例
私が考える「仮説の不要な研究」は、例えば複数のサンプルを使った次世代シークエンスなどの big data があって、そこから相関して変化しているものをスクリーニングするようなものである。具体例を想像してみると、

「カエルの発生段階別 NGS データで、足が生えてきたら発現が変化する遺伝子を探す。足の発生に関わっている可能性がある。」

この論文のイントロは、以下のようになるだろう。

・カエルは、発生段階の初期には足がない(オタマジャクシ)
・足の発生を制御する遺伝子は同定されていない
・NGS スクリーニングの有効性、カエルの他の遺伝子の例など
・そこで本研究では・・・

ここに無理矢理仮説をくっつけるとすると、以下のようなパターンが考えられる。

1. 足の発生の前後で発現が変化している遺伝子が、発生に関わっているという仮説を検証した。

これだと、スクリーニングした遺伝子が足の発生に関わっているということまで論文内で示さなければならなくなる。


2. 足の発生の前後で、何らかの遺伝子発現が変化しているという仮説を検証した。

仮説がブロードすぎて、意味がないように思う。


3. 実際にAという遺伝子がとれたら、Aを含む遺伝子ネットワークBについて「Bが発生に重要なので、この系が関わっているものと仮説を立てた」とする。

で、実際にAの発現が変化していたので、「仮説は支持された」ということになる。これが、ツイッターで一瞬話題になったHARKing (hypothesizing after the results are know) というやつである。ちなみに、HARKing という言葉で出てくる仮説は、このような論文のストーリー上の仮説を指す場合と、統計検定における帰無仮説を指す場合があるようである。かなり話が違ってくるので、HARKingを議論する際は注意したい。

実際のところ、無理矢理仮説をくっつける場合には、3が一番よく行われているように思う。しかし、1-3のいずれもあまり意味がない。

「論文には仮説が必須」「Research questionがない論文は無意味」というのは、特定の分野では説得力のあるルールかもしれないが、ケースバイケースであると考えたい。

追記:
HARKingに関しての話なら、私は論文のストーリー上の仮説を後から作るのは、まあ仕方ない場合もあるという立場である。実際、「Xを想定していたけどYになりました。その解釈は・・・」という論文で、イントロにXのことばっかり書いてあったら非常に読みにくい論文である。

論文のストーリー記述方法としてはまあありで、複数の論文を俯瞰したときに、分野として再現性があれば良いのではないかと思う。

これを研究不正としてしまうと、仮説が著者の頭にない段階(上記のカエル論文のようなケース)で、Reviewerに「仮説は?」と聞かれた場合に、withdrawしなければならなくなる。

2019/05/07

K to 12 (または K-12) の意味: 何を表しているのか?

K-12のようにハイフンでつなぐ場合は、K through twelve と読む。

K は、アメリカの幼稚園 kindergarten の K である。これはドイツ語の「子供 kinder」と「庭 garten」に由来するので、garDen ではなく garTen であることに注意。

12 は、高校卒業までの 12 年間を示す。アメリカでは、小中高の年数は州によって異なっているが、

・小学校 elementary school: 5 年間
・中学校 middle school: 3 年間
・高校 high school: 4 年間

という5・3・4制が主流で、トータル 12 年となる。基本的に K から高校までが義務教育なので、一般に K-12 は義務教育期間を指す 言葉として使われる。

K-12 teachers という表現もある。


参考:
1. アメリカの学校での学年・年齢について知りたい人はこちらへ.

2018/09/17

つける? つけない? PhDと書く場合のピリオドとスペース

前から悩ましく思っていたので、この際にちょっと調べてみた。

Doctor of Philosophy の略であるから、原則的にはピリオドがつき、かつ 2 つの単語として認識されるべきである。つまり "Ph. D." だ。

ただし、これは字面的にあまりよろしくない。略号は、それが広く受け入れられているならばピリオドやスペースを省くことも可能である。たとえば DNA。これは deoxyribonucleic acid なので、D. N. A. であり、昔の文献ではこう書いている例もあるが、現在は DNA が普通だろう。

cm (centimeters), mg (milligrams) など、他にも例はたくさんある。Ph. D. も同様で、PhD と書いた方がすっきりする。

よって、この PhD という書き方がどの程度広く受け入れられているかというのがポイント。

The Chicago Manual of Style (CMOS) という英文スタイルについてのマニュアルがあり、ここでは次のように定められている。

Use no periods with abbreviations that appear in full capitals, whether two letters or more and even if lowercase letters appear within the abbreviation: VP, CEO, MA, MD, PhD, UK, US, NY, IL.

つまり、このマニュアルでは「全部大文字の場合、基本的にピリオドなし(それに伴い、たぶんスペースもなし)」と定めている。これを根拠として、現状では PhD とするのが妥当と思える。


ただし、イギリスでは、大学によって D.Phil と表記する場合もあるようだ。このあたりは多様性があってもよいと思う。

2018/06/23

食品科学でよく使われる mg% という単位

見慣れない単位だけど、どうやら試料 100 g 中に含まれる量を mg 単位で表したものらしい。つまり、10 mg% なら食品 100 g 中に 10 mg 入っているということ。

食品科学など歴史の長い分野では、こういう変な単位が残っていることがある。たとえば血糖値は、いまだに mg/dL で表されることがある。デシリットルなんて、小学校以来使わない単位だと思う。
2018/04/11

薬品を生物に投与し,組織への取り込み量を測定するような実験

以下のページをUBC に移動しようと思ったが、とりあえずブログにアップ。あとで時間がとれたら整理する。

-----
何らかの薬品を生物に投与し,組織への取り込み量を測定するような実験には,ある程度決まった方法論がある。このページでは,実験の基本的な手順や,このような実験を計画するときの注意点 についてまとめる。
 
多くの論文では,単純に目的物質を定量するだけでなく
 
  • 回収率 recovery rate
  • 検出限界 quantification limit
  • 同じサンプルから定量した際の誤差 intra- and inter-day variation
 
なども算出している。
参考にした文献の内容は以下のとおり。
 
1. 漢方薬の成分である baicalin をラットに投与し(i.v. 単回投与),脳内の量を 逆相 HPLC で測定。
3. 食品中のソルビン酸,安息香酸 benzoic acid を抽出し,逆相 HPLC で定量。
投与法

経口投与および静脈注射 i.v. infusion がよく使われる。単回投与 single dosage の方が解釈が簡単になりそう。
 

静脈注射
  • 目的物質は水溶性か,脂溶性か?
  • 水溶性の場合,水に溶かすか,緩衝液に溶かすか?
  • 脂溶性の場合,溶媒は生体に影響を与えないか?
  • 目的物質の投与量はどれぐらいになるか? 達成したい血中濃度と血液量から算出することになる。
  • ラットの血液量は,約 70 mL/kg body weight である(2)。
  • Blood に血液量の一覧があります。
  • どれぐらいの液量を注入することになるか? 目的物質の溶解度と投与量から計算。
 
 
経口投与
  • 動物がその餌をコントロールの餌と同じぐらい食べるか?
  • 食べる量が変わったとしたら,それによる影響は?
  • どれぐらいが血液中に移行するか? 最大濃度,時間など。
 
 
組織からの抽出
  • どんな溶媒で抽出するか?
  • 回収率の検討

> 文献 3 では抽出に水蒸気蒸留を用いており,抽出を繰り返して回収率と留出パターンを求めている(3)。
: 安息香酸標準液(0.1 g/kg)を試料に,100 mL ごとの画分で 600 mL まで流出液を採取する。
: 画分 1, 2, 3... に含まれる安息香酸の量を測定する。
: 1 回目で 85%, 2 回目で 95% のように,回収率が上がっていき,やがて上限に達する。
検出限界 Quantification limit

> 検量用標準液の最低濃度(安息香酸 0.1 µg/ml)測定時の標準偏差の3倍を検出限界値としている(3)。
> "The quantification limit ... defined as a signal-to-noise ratio of 3:1 was 10 ng/ml (1).


  1. Zhang et al. 2005a. A chromatographic method for baicalin quantification in rat thalamus. Biomed Chromatgr 19, 494-497.
  2. Rat Biomethodology, Laboratory of Animal Resource Center, The University of Texas at San Antonio.
  3. 山上ほか 2010a. 高速液体クロマトグラフィーによる食品中のソルビン酸,安息香酸分析法について. 山梨衛環研年報, 54, 48-51.