Some wiki page should probably define exactly what this is and what the data means. This is the first draft of the avro schema, it is a direct transliteration of the existing CirrusSearchRequests log:
'CirrusSearchRequests' => array( 'type' => 'record', 'name' => 'CirrusSearchRequests', 'namespace' => 'org.wikimedia.search', 'fields' => array( array( 'name' => 'query', 'type' => 'string' ), array( 'name' => 'queryType', 'type' => 'string' ), array( 'name' => 'numBatch', 'type' => array( 'int', 'null' ) ), array( 'name' => 'tookMs', 'type' => array( 'int', 'null' ) ), array( 'name' => 'source', 'type' => 'string' ), array( 'name' => 'executor', 'type' => 'int' ), array( 'name' => 'identity', 'type' => 'string' ), array( 'name' => 'index', 'type' => 'string' ), array( 'name' => 'elasticTookMs', 'type' => array( 'int', 'null' ) ), array( 'name' => 'hitsTotal', 'type' => array( 'int', 'null' ) ), array( 'name' => 'hitsReturned', 'type' => array( 'int', 'null' ) ), array( 'name' => 'hitsOffset', 'type' => array( 'int', 'null' ) ), array( 'name' => 'namespaces', 'type' => array( 'type' => 'array', 'items' => 'int' ) ), array( 'name' => 'suggestion', 'type' => 'string' ), ), ),