Some wiki page should probably define exactly what this is and what the data means. This is the first draft of the avro schema, it is a direct transliteration of the existing CirrusSearchRequests log:
'CirrusSearchRequests' => array(
'type' => 'record',
'name' => 'CirrusSearchRequests',
'namespace' => 'org.wikimedia.search',
'fields' => array(
array( 'name' => 'query', 'type' => 'string' ),
array( 'name' => 'queryType', 'type' => 'string' ),
array( 'name' => 'numBatch', 'type' => array( 'int', 'null' ) ),
array( 'name' => 'tookMs', 'type' => array( 'int', 'null' ) ),
array( 'name' => 'source', 'type' => 'string' ),
array( 'name' => 'executor', 'type' => 'int' ),
array( 'name' => 'identity', 'type' => 'string' ),
array( 'name' => 'index', 'type' => 'string' ),
array( 'name' => 'elasticTookMs', 'type' => array( 'int', 'null' ) ),
array( 'name' => 'hitsTotal', 'type' => array( 'int', 'null' ) ),
array( 'name' => 'hitsReturned', 'type' => array( 'int', 'null' ) ),
array( 'name' => 'hitsOffset', 'type' => array( 'int', 'null' ) ),
array( 'name' => 'namespaces', 'type' => array( 'type' => 'array', 'items' => 'int' ) ),
array( 'name' => 'suggestion', 'type' => 'string' ),
),
),