個々のEDC/CDMS(以下面倒なのでEDCとして表記)の仕様についてのお話です。現在市場には様々なEDCが出回っております。それぞれ様々な特徴がありますが、今回は「できる」と「やりようがある」の違いについて軽めのエントリーです。個々のEDCではいったい何が違うのか?低価格帯のEDCは何かがダメなのか?
低価格帯なら「やりようはある」を重視
そもそも紙で運用している状態からしたら、EDCを使うことを自体が「凄い」ことの様に感じられることでしょう。個々のシステムの違いというのは、わかりづらいもので、高いと安いの違いはいったい?という疑問が多々あると思います。もちろん、EDCにかかる費用は、様々な要素によって決まりますが、開発費を回収できなければ商品として成り立たないので、開発への投資を要するEDCほど(ユーザー側に)費用がかかる、というのはある程度言えると思います。ざっくり言うと、高いものほど機能が充実している、ということです。ですが、安かろう悪かろうというのも、また当てはまりません。
紙媒体で運用している臨床試験も多いわけで、紙ペラにはこれといった「機能」は備わっておりません。先日の記事でも触れましたが、紙媒体での運用は完全に「やりようはある」で固めています。EDCだからと言って、全てにおいて理想を追い求めるの必要もなく、「望ましいもの」の優先順位を付けていく方が良いと考えます(いや、EDCに限った話ではありませんが)。今回はEDCの幹になっているデータ構造に起因する仕様上の問題について、一例紹介したいと思います。
続・データの縦持ち・横持ち
システムを選ぶ場合、もちろん予算との相談が大きなファクターになると思われます。そこで(個人的に)重要視して欲しいのが、すぐに豪華な機能に飛びつくより、「やりようはあるか?」という見方です。機能として備わっていなくても、運用をちょこっと工夫することでなんとかなりそう…という考え方ですね。例えば、繰り返し項目が設定できないEDCシステムがあったとします。有害事象や併用薬の情報は、基本的に一人の患者で何回起きるのかがわからないものです。ここで選択肢としては二つあります:
- 諦めて他のシステムを検討する
- 想定される一定数の有害事象、併用薬の入力欄を設けてみてはどうか?と考えてみる
具体的には、こういうことです:
項目ID | 項目名 | データ型 | 値 |
1 | 事象名 | テキスト | 頭痛 |
1 | 発症日 | 日付 | 2015/12/15 |
1 | 転帰日 | 日付 | 2015/12/18 |
1 | 重症度 | カテゴリ | 1 |
1 | 重篤度 | 二値変数 | NO |
2 | 事象名 | テキスト | 副鼻腔炎 |
2 | 発症日 | 日付 | 2015/12/25 |
… | … |
繰り返し項目が可能な場合、上の表の様な構造になっています(注:実際にはこれでは列も行も足りないのですが、あくまでイメージ)。以前の記事で紹介した、縦持ちの構造ですね。個々の有害事象に何らかの固有のIDが振られ、有害事象が新たに追加されたら、この表に行が5つ追加されます。有害事象がどれだけ増えても列数は一定ですので、統計ソフトで処理するときも同じプログラムの使い回しが容易に行えます。縦持ちでなくても、下表の様な構造になっていても繰り返し項目として処理できます。
AEID | 事象名 | 発症日 | 転帰日 | 重症度 | 重篤度 |
1 | 頭痛 | 2015/12/15 | 2015/12/18 | 1 | NO |
2 | 副鼻腔炎 | 2015/12/25 | 2016/01/04 | 2 | NO |
3 | … | … | … | … | … |
この場合、有害事象が追加されると表に一行のみ追加され、連番を示すAEIDが1上がるイメージです。
さて、問題は、下表の様な構造をしている場合です:
SUBID | 事象名 | 発症日 | 転帰日 | 重症度 | 重篤度 |
1 | 頭痛 | 2015/12/15 | 2015/12/18 | 1 | NO |
2 | … | … | … | … | … |
3 | … | … | … | … | … |
一列目に格納されているのは、被験者の識別子であるため、行の追加=被験者の追加を意味します。一つの項目は、この表の中では一つの被験者で一度しか存在することができないので、有害事象が二つある場合はデータが格納できなくなってしまいます。一つの解決策としては、繰り返しが想定されるものについては下表の様に同じ項目のコピーを設けておくことです:
SUBID | 事象名01 | 発症日01 | 転帰日01 | 重症度01 | 重篤度01 | 事象名02 | 発症日02 | 転帰日02 | 重症度02 | … |
1 | 頭痛 | 2015/12/15 | 2015/12/18 | 1 | NO | 副鼻腔炎 | 2015/12/25 | 2016/01/04 | 2 | … |
2 | … | … | … | … | … | … | … | … | … | … |
業界用語で言うところの「太っちょ」の誕生です。正直、後の加工のことを考えると望ましい形式とは言い難いのですが、このようにして割り切ることで、一応「データ収集」という役割を果たすことができます。EDCの画面上では、有害事象1、有害事象2、と言う具合にあらかじめ入力欄が設けられるイメージになります。不格好と言えば不格好ですし、この様にして設ける入力欄の数は、想定される最大数に合わせるため、多くの「未入力」を生み出すことになります。たとえば、有害事象の枠を10設けたとしたら、有害事象が発生しなかった場合、上の例だと10 x 5 = 50の空欄が残ります。この手法で太っちょを大量に生成すると、スカスカの表になってしまいます。もちろん、この場合は当該EDCシステムの仕様上致し方ないのですが、後の処理が面倒になることも考慮して、「できる」と「やりようがある」のどちらを取るかが重要になってきます。
次回は「監査証跡のフル活用」についてです。
コメント