certified random orderによる著者名の並べ方

AER(American Economic Review)という雑誌に掲載された以下の「Ray ⓡ Robson (2018)」という論文の内容についての話です(著者名の区切に「ⓡ」という記号を使っている理由はあとで説明します)。

Ray, Debraj ⓡ Arthur Robson (2018) "Certified Random: A New Order for Coauthorship," American Economic Review, Vol. 108, No. 2, pp. 489–520, DOI: 10.1257/aer.20161492.

論文等を共著で書いたときには、著者名をどういう順番で並べるかを選ぶ必要があります。分野によっても変わってくるかと思いますが、よく使われる方法には、1) 論文の執筆における貢献の大きさ順で並べるという方法、2) アルファベット順で並べるという方法(今は話を英語の論文に限定しています)があると思います。

アルファベット順

論文の執筆の貢献度が著者の間でかなり違う場合には貢献度順が使われることが多いのでしょうが、貢献度が同じような場合にはアルファベット順が多いかもしれません。実際、経済学ではアルファベット順の利用がかなり多いようです。ただ、アルファベット順には大きな欠点があります。それはたまたまアルファベットの若い名前を持つ人を大きく優遇することになるという点です。

実際にどれくらい優遇することになるかはRay ⓡ Robson (2018)でも説明されています。Ray ⓡ Robson (2018)では以下の論文が紹介されています。

Einav, Liran, and Leeat Yariv. (2006) "What's in a Surname? The Effects of Surname Initials on Academic Success." Journal of Economic Perspectives, 20 (1), pp.175–88, DOI: 10.1257/089533006776526085.

このEinav and Yariv (2006)は、米国のトップ35の経済学部の教員を対象に、名前と業績の関係について調査、分析したものだそうです。分析の結果、若いアルファベットの姓を持つ教員ほどトップ10の経済学部におけるテニュアを得る可能性が優位に高く、クラークメダルとノーベル賞を受賞する確率も高いということがわかったそうです(これは、出身国、人種、宗教、学部等の要素をコントロールした上で導かれた結果です)。他にも証拠となるようなデータがあるようです(詳しくはRay ⓡ Robson (2018)を見てください)。

[注]ただし、上記の研究に反論するような研究もあります。例えば、以下の論文は、アルファベット順による第一著者優遇の効果は従来言われているほどには大きくはないという結果を導いています。

Ong, D., Chan, H. F., Torgler, B., and Yang, Y. (2018). "Collaboration incentives: Endogenous selection into single and coauthorships by surname initial in economics and management." Journal of Economic Behavior and Organization, 147, pp.41–57. 10.1016/j.jebo.2018.01.001

ランダム順

アルファベット順では名前によって有利、不利が生じてしまうということなので、それではランダムに順番を決めてやればいいのではとなります。例えば、Abeさん、koizumiさんという2人がよく共同論文を書いていて、論文を書くたびにサイコロを振って著者名の順序を決めたとすると、Abeさんが特に優遇されるというようなことはなくなりそうです。

しかし、ランダムな並べ方には一つ問題があります。それは、仮にランダムに決めた結果として「Koizumi and Abe」という順番になったときでも、それをKoizumiさんが論文の執筆において大きい貢献をしたために第一著者になっているとみなしてしまう人が出てくるという点です。そうなると逆にKoizumiさんを優遇することになってしまいそうです。

最初に述べたように、並べ方としては貢献順という方法もよく使われています。著者自身はランダムに並べた結果「Koizumi and Abe」としている場合であっても、第三者からはそれがランダム順なのか、貢献順なのかが判断できません。

Certified random order(保証されたランダム順)

以上のように単純なランダム順では問題があるということで、Ray ⓡ Robson (2018)で提案されているのが「certified random order」というランダム順です。単純なランダムと何が違うかというと、ランダムで著者順を決めているということがわかるように特別な記号(区切)を利用するということです。上の例で言えば、「Koizumi and Abe」ではなく、「Koizumi ⓡ Abe」というように表現するということです。

単に「Koizumi and Abe」なら、Koizumiさんが貢献度が大きいのかと思う人がでてきますが、「Koizumi ⓡ Abe」のようにこれは「ランダム順」ということを示す記号を用いれば、貢献順と誤解されることはなくなり、本当の意味でのランダム順ということを明示することができます。

「論文の著者が保証(certify)したランダム(これはランダムに決めた並び順と著者によって保証されている)」ということで「certified random order」という呼び方を使っているようです。ランダムということを表す記号としてはどういうものでもよいようですのですが、Ray ⓡ Robson (2018)では「®」を使っています。ただ、これは既に商標のマークとして使われていますので、Ray は代わりに「ⓡ」を提案しています。そのため、この文章でも「ⓡ」を使っています。ただし、ⓡを使うべきといういわけではなく、別のものでもよいと思います(できるだけ統一していた方がわかりやすいですが)。とりあえず考え方を説明するだけでしたら、「and」で区切るのでなければ何でもいいかと思います。

「certified random order」という方法はいろいろ良い性質を持つようです。それをRay ⓡ Robson (2018)で長々と証明をしています(私にはよくわからないので、詳しくは論文を見てください)。

一つ誤解を招きやすい点ですが、randomに並べるというのは、引用するたびにランダムに著者名を並べ替えるということではないです。元々、著者達が決めた並び順で常に引用するのですが、その元の並び順を著者は(貢献順等ではなく)ランダムな方法で決めましたよということです。一度、著者が決めた並び順は固定されます。

certified random orderの実装

なぜ certified random order の話をしたのかというと、certified random orderをBibTeX で実現できないかと Raraj Ray と Martin Osborneに聞かれたからです(Raraj Rayは上記の論文の著者であり、Martin Osborneは有名なゲーム理論のテキストの著者ですね)。それほど難しいことではなかったので、https://github.com/ShiroTakeda/econ-bstというページで開発している econ.bst というBibTeXのスタイルファイルで certified random orderを使えるようにしました。

Certified random orderを使う方法ですが(詳しくはecon.bstのマニュアルを読んでもらいたいのですが)、データベース(bibファイル)でcertified random orderを使っていることを指定するという方法にしています。具体的には、certified random orderを利用している文献については、「nameorder」というフィールドに「random」という値を 設定するという方法をとっています。例えば、以下のような指定をします。

@techreport{NBERw25205,
  title        = {Electoral Systems and Inequalities in Government
                  Interventions},
  author       = {Garance Genicot and Laurent Bouton and Micael Castanheira},
  institution  = {National Bureau of Economic Research},
  type         = {Working Paper},
  series       = {Working Paper Series},
  number       = 25205,
  year         = 2018,
  month        = {October},
  doi          = {10.3386/w25205},
  URL          = {http://www.nber.org/papers/w25205},
  nameorder    = {random}
}

このように指定された文献を引用すると、参考文献部分で

Genicot, Garance ⓡ Laurent Bouton ⓡ Micael Castanheira (2018) "Electoral Systems and In- equalities in Government Interventions," Working Paper 25205, National Bureau of Economic Research, URL: http://www.nber.org/papers/w25205, DOI: 10.3386/w25205.

というような表記になり、さらに引用部分では「Genicot ⓡ Bouton ⓡ Castanheira (2018)」、あるいは「Genicot ⓡ al.(2018)」という形になります。後者のような省略形の場合、「et」の代わりに「ⓡ」を使っています(etはラテン語でandの意味なので)。「author」フィールドの指定は通常の方法と変わりません。

certified random orderの今後

このcertified random orderという表記の方法が今後普及するかどうかはわかりません。ただ、普及させるには文献データベース側での対応が必要になると思います。具体的には、文献のデータベース側でその論文の著者名の並び方がcertified random orderなのかどうかを示す情報を持つようにしないといけないと思います。例えば、私がecon.bstで実装したように、bibファイルにおいてnameorderというフィールドにrandomという値を持たせるというようにです。

現在、ネット(例えば、Google scholarやIDEAS)などでBibTeX形式の文献情報を得ることができますが、それらのデータベースの論文においてcertified random orderが使われているのかどうかという情報は含まれていません。例えば、「これ」Google Scholarから取得できる「Ray ⓡ Robson (2018)」のBibTeX形式の文献情報ですが、certified random orderを使っているという情報は全く含まれていません。情報がなければ引用する際にcertified random orderの表記を使うべきかどうかもそもそもわかりません。まずは引用する側がその文献がcertified random orderを使っているかを簡単に判断できるようにデータベース側が対応する必要があると思います。

以上、certified random orderについて説明しましたが、普段、アルファベット順で著者名を並べているという人、その中でも特に姓のアルファベットが後ろの方なのでいつも第一著者にはなれていないという人は「certified random order」を使うように共著者に提案してみるといいかもしれません。有名な研究者が使うようになれば、多くの人が使うようになるかもしれないですね。私自身はたぶん使う機会がなさそうです...というのは、私は元々アルファベット順で著者名を並べることがほとんどないもので。