お馬の写真 別館

「お馬の写真」管理者による徒然なるブログ

DataLab.を使ってサイアーラインを可視化してみる(その4)

   

a0002_009631

「DataLab.を使ってサイアーラインを可視化してみる」シリーズ(?)の4回目。

実際にどんな感じにサイアーラインを可視化できているのか見てみましょう。

現状

ちょっと大きいのでリンクだけにしておきますが、今のところこんな感じ

前回との差分点としては、

  • サラブレッドとサラブレッド系に限定
  • サイアーラインの伸びる方向を左から右に変更
  • 図の大きさを2/3に縮小。

といったところ。

直さないと行けないところ

今のところ直さないと行けないところはこの辺。

親子関係が切れているものがありそう

三大始祖以外からのサイアーラインが2本出ています。おそらくどこかで親子関係の情報がきれているのかな。

sireline_nolink

ちなみに上から2行目のラインはダノンレジェンドから遡るラインですね。

1頭の馬が複数のデータにわかれている

輸入種牡馬やシャトル種牡馬だと、輸入前後で複数データに分かれているものがあります。

sireline_dup

たとえば「End Sweep」と「エンドスウィープ」みたいなもの。

他にもパッと見た範囲だと、

  • フォーティナイナー
  • デインヒル
  • ラストタイクーン
  • ワイルドラッシュ
  • トニービン (アウォーディーの影響?)
  • ジャングルポケット (アウォーディーの影響?)
  • サンデーサイレンス (キンシャサノキセキの影響)
  • フジキセキ (キンシャサノキセキの影響)
  • オジジアン

が複数にわかれている模様。真面目に見ればもっとありそう。

複数データにわかれているのを対応してみる

1頭が複数データに分かれているものをまず対策してみようかな、と思います。

ひとまとめにするルールとしては

  • 生年が同じ
  • 英語名が一緒
  • 父が一緒

としてみます。

ひとまとめにしたらその子供たちの父馬も書き換え、というのを順次実施していく、ということをおこなった結果がこちら

さきほどあげていたエンドスウィープあたりはこんな感じに改善されます。
sireline_endsweep

残りはサイアーラインが切れているところのケアをどうするか、ですね。また、どういうデータになっているかを確認してから対応していきたいと思います。

 - プログラミング