Page MenuHomePhabricator

sample_output_20210318.json

Authored By
HannaLindgren
Mar 18 2021, 6:19 PM
Size
15 KB
Referenced Files
None
Subscribers
None

sample_output_20210318.json

{
"printed": "2021-03-18 19:16:33",
"stats": {
"scripts": 2,
"size": 60
},
"scripts": [
{
"script_metadata": {
"message": {},
"options": {
"mode": "exhaustive",
"feature_opts": [
{
"name": "bigram_transition",
"target_amout": 0
},
{
"name": "bigram_top800",
"target_amout": 3
},
{
"name": "final_trigram",
"target_amout": 0
},
{
"name": "initial_bigram",
"target_amout": 0
},
{
"name": "word",
"target_amout": 0
},
{
"name": "bigram",
"target_amout": 0
}
],
"adjust_score_for_sentence_length": false,
"target_size": 20,
"from_batch": "test_batch_1",
"script_name": "test_script_1",
"accumulated_scripts": [],
"chunk_size": 1,
"chunk_decrease": 0,
"min_iterations": 50000,
"cutoff": 100
},
"input_size": 40000,
"output_size": 20,
"timestamp": "2021-03-18 17:51:17"
},
"batch_metadata": {
"message": {},
"batch_name": "test_batch_1",
"target_size": 40000,
"opts": [
{
"name": "word_count",
"args": [
"4",
"25"
]
},
{
"name": "comma_count",
"args": [
"0",
"25"
]
},
{
"name": "lowest_word_freq",
"args": [
"2"
]
},
{
"name": "exclude_chunk_re",
"args": [
"[\\p{Greek}]"
]
},
{
"name": "exclude_chunk_re",
"args": [
"[^a-zA-Z\u00e5\u00e4\u00f6\u00c5\u00c4\u00d6\u00e9\u00c9\u00fc\u00dc0-9 ,$\u20ac\u00a3@.!?/()\"':\u2014\u2013-]"
]
}
],
"output_size": 40000,
"timestamp": "2021-03-18 17:50:08"
},
"sentences": [
{
"id": 50809,
"text": "I Sverige fick organisationen negativ uppm\u00e4rksamhet efter en reklamfilm inneh\u00e5llande det svenska kungaparet utnyttjades utan dess till\u00e5telse samt att filmen inneh\u00f6ll arrangerad och felaktig fakta.",
"source": "https://sv.wikipedia.org/wiki?curid=1668"
},
{
"id": 27795,
"text": "Enligt den grekiske historikern Plutarkos skall Caesar ist\u00e4llet ha dragit sin toga \u00f6ver ansiktet n\u00e4r han s\u00e5g att Brutus var med i gruppen av l\u00f6nnm\u00f6rdare.",
"source": "https://sv.wikipedia.org/wiki?curid=939"
},
{
"id": 6218,
"text": "Dygd anses ocks\u00e5 hj\u00e4lpa ut\u00f6vare att genom gl\u00e4dje och n\u00f6je utveckla meditativt lugn och ge insikter och med tiden leda till att man uppn\u00e5r nirvana.",
"source": "https://sv.wikipedia.org/wiki?curid=199"
},
{
"id": 54911,
"text": "Man kan betrakta Jobs bok i Bibeln som en djup meditation \u00f6ver det of\u00f6rtj\u00e4nta lidandets och ondskans roll i en v\u00e4rld d\u00e4r Gud r\u00e5der.",
"source": "https://sv.wikipedia.org/wiki?curid=1876"
},
{
"id": 30525,
"text": "Med k\u00e4rnbr\u00e4nslecykeln avses den kedja av \u00e5tg\u00e4rder och processer som bereder k\u00e4rnbr\u00e4nsle till reaktorerna och tar hand om detta hela v\u00e4gen fr\u00e5n malmbrytning till avfallshantering.",
"source": "https://sv.wikipedia.org/wiki?curid=1012"
},
{
"id": 32135,
"text": "Lotta p\u00e5 Liseberg med Lotta Engberg som hade \u00e4gt rum ett antal somrar p\u00e5 Stora scenen, s\u00e4ndes f\u00f6r f\u00f6rsta g\u00e5ngen p\u00e5 TV i TV4 2009.",
"source": "https://sv.wikipedia.org/wiki?curid=1073"
},
{
"id": 45581,
"text": "S\u00e5 gott som allt j\u00e4rn p\u00e5 skeppet rostade bort p\u00e5 bara n\u00e5gra \u00e5r efter katastrofen och av de st\u00f6rre j\u00e4rnf\u00f6rem\u00e5len som kanonkulor \u00e5terstod enbart kol.",
"source": "https://sv.wikipedia.org/wiki?curid=1529"
},
{
"id": 51346,
"text": "Eftersom befintlig v\u00e4ggbekl\u00e4dnad inte kunde \u00f6verf\u00f6ras till de nya innerv\u00e4ggarna kl\u00e4ddes dessa med glasfiberv\u00e4v, som m\u00e5lades med plastf\u00e4rg och med Carl Larssons schabloner rekonstruerade.",
"source": "https://sv.wikipedia.org/wiki?curid=1694"
},
{
"id": 53763,
"text": "I fjorton \u00e5r drev H\u00e5kansson sitt v\u00e4rdshus och efter hans d\u00f6d f\u00f6rvandlades v\u00e4rdshuset till en mer traditionell krog med utsk\u00e4nkning av \u00f6l och br\u00e4nnvin.",
"source": "https://sv.wikipedia.org/wiki?curid=1823"
},
{
"id": 18963,
"text": "Efter s\u00e4songen gick tr\u00e4narduon Roland Nilsson och Hans Gren till Malm\u00f6 FF. 2008 slutade Gais \u00e5ter p\u00e5 elfte plats i Allsvenskan, med Magnus Pehrsson som huvudtr\u00e4nare.",
"source": "https://sv.wikipedia.org/wiki?curid=661"
},
{
"id": 3831,
"text": "\u00c5r 1782 k\u00f6pte Samuel Forsmarks bruk som \u00e4gdes inom familjen fram till 1975. Samuel af Ugglas hustru var Carolina Wittfoth vars far var brukspatron p\u00e5 Gysinge bruk.",
"source": "https://sv.wikipedia.org/wiki?curid=108"
},
{
"id": 58970,
"text": "Som auktorit\u00e4r konservativ regim stod Vichyregimen den tyska n\u00e4ra och m\u00e5nga dekret som p\u00e5bj\u00f6ds av tyskarna inf\u00f6rdes \u00e4ven av Vichyregimen, ibland p\u00e5 dess eget initiativ.",
"source": "https://sv.wikipedia.org/wiki?curid=2023"
},
{
"id": 9211,
"text": "I Danmark utf\u00f6rde han ett antal portr\u00e4tt, bland annat av kung Fredrik V och drottning Juliana Maria av Braunschweig-Wolfenb\u00fcttel samt de kungliga barnen.",
"source": "https://sv.wikipedia.org/wiki?curid=336"
},
{
"id": 49494,
"text": "Science fiction \u00e4r en genre inom litteratur och film d\u00e4r b\u00e4rande element i intrig eller milj\u00f6 har inslag grundade p\u00e5 vetenskapliga eller teknologiska spekulationer.",
"source": "https://sv.wikipedia.org/wiki?curid=1643"
},
{
"id": 3803,
"text": "Efter andra v\u00e4rldskrigets utbrott och i samband med samlingsregeringens bildande fick Engberg l\u00e4mna regeringen och blev ist\u00e4llet utsedd till landsh\u00f6vding i V\u00e4sternorrlands l\u00e4n.",
"source": "https://sv.wikipedia.org/wiki?curid=106"
},
{
"id": 18749,
"text": "N\u00e4r Carl Gustaf Tessin var svenskt s\u00e4ndebud i Paris 1739\u201342 kunde Lundberg bo hos honom p\u00e5 den svenska beskickningen, vilket ytterligare \u00f6kade hans prestige och klientel.",
"source": "https://sv.wikipedia.org/wiki?curid=656"
},
{
"id": 11796,
"text": "N\u00e4sta stora framsteg kom 1958, d\u00e5 Jack Kilby p\u00e5 Texas Instruments och Robert Noyce p\u00e5 Fairchild uppfann den integrerade kretsen, vilken medf\u00f6rde \u00e4nnu effektivare miniatyrisering.",
"source": "https://sv.wikipedia.org/wiki?curid=449"
},
{
"id": 8123,
"text": "P\u00e5 uppdrag av Germund Ludvig Cederhielm utarbetade arkitekten Fredrik Magnus Piper (1746\u20131824) en serie f\u00f6rslag till manbyggnad i nyklassicistisk stil i enlighet med byggherrens speciella \u00f6nskem\u00e5l.",
"source": "https://sv.wikipedia.org/wiki?curid=312"
},
{
"id": 26460,
"text": "Skriften handlar framf\u00f6r allt om Jungfru Marias liv fram till tiden n\u00e4r Jesus \u00e4r nyf\u00f6dd, och ber\u00e4ttar om hennes jungfrudom och helighet.",
"source": "https://sv.wikipedia.org/wiki?curid=905"
},
{
"id": 16481,
"text": "Precis som i l\u00e4ngdhopp och i tresteg har varje kastare i m\u00e4sterskap tre kast p\u00e5 sig och det \u00e4r det l\u00e4ngsta kastet som r\u00e4knas.",
"source": "https://sv.wikipedia.org/wiki?curid=576"
}
]
},
{
"script_metadata": {
"message": {},
"options": {
"mode": "exhaustive",
"feature_opts": [
{
"name": "bigram_transition",
"target_amout": 0
},
{
"name": "bigram_top800",
"target_amout": 3
},
{
"name": "final_trigram",
"target_amout": 0
},
{
"name": "initial_bigram",
"target_amout": 0
},
{
"name": "word",
"target_amout": 0
},
{
"name": "bigram",
"target_amout": 0
}
],
"adjust_score_for_sentence_length": true,
"target_size": 40,
"from_batch": "test_batch_1",
"script_name": "test_script_2",
"accumulated_scripts": [
"test_script_1"
],
"chunk_size": 1,
"chunk_decrease": 0,
"min_iterations": 50000,
"cutoff": 100
},
"input_size": 40000,
"output_size": 40,
"timestamp": "2021-03-18 17:52:29"
},
"batch_metadata": {
"message": {},
"batch_name": "test_batch_1",
"target_size": 40000,
"opts": [
{
"name": "word_count",
"args": [
"4",
"25"
]
},
{
"name": "comma_count",
"args": [
"0",
"25"
]
},
{
"name": "lowest_word_freq",
"args": [
"2"
]
},
{
"name": "exclude_chunk_re",
"args": [
"[\\p{Greek}]"
]
},
{
"name": "exclude_chunk_re",
"args": [
"[^a-zA-Z\u00e5\u00e4\u00f6\u00c5\u00c4\u00d6\u00e9\u00c9\u00fc\u00dc0-9 ,$\u20ac\u00a3@.!?/()\"':\u2014\u2013-]"
]
}
],
"output_size": 40000,
"timestamp": "2021-03-18 17:50:08"
},
"sentences": [
{
"id": 3869,
"text": "Aln\u00f6n \u00e4r k\u00e4nd f\u00f6r sin jakt p\u00e5 vilt d\u00e5 det \u00e4r gott om vilda djur.",
"source": "https://sv.wikipedia.org/wiki?curid=112"
},
{
"id": 36913,
"text": "Kant ans\u00e5g att vi inte kan n\u00e5 \u00e5t tinget i sig.",
"source": "https://sv.wikipedia.org/wiki?curid=1245"
},
{
"id": 9335,
"text": "En match \u00e4r d\u00e5 \u00f6ver p\u00e5 ca tre timmar.",
"source": "https://sv.wikipedia.org/wiki?curid=337"
},
{
"id": 67722,
"text": "Man kan ocks\u00e5 koka en lag p\u00e5 redan en g\u00e5ng anv\u00e4nd bark och f\u00e5r \u00e4ven d\u00e5 en svag lag.",
"source": "https://sv.wikipedia.org/wiki?curid=2510"
},
{
"id": 8276,
"text": "Han hade d\u00e5 gjort en resa i varje l\u00e4n.",
"source": "https://sv.wikipedia.org/wiki?curid=316"
},
{
"id": 70804,
"text": "Typ a och b finns hos gr\u00f6na v\u00e4xter.",
"source": "https://sv.wikipedia.org/wiki?curid=2630"
},
{
"id": 67646,
"text": "Yrket gick i arv fr\u00e5n far till son.",
"source": "https://sv.wikipedia.org/wiki?curid=2509"
},
{
"id": 43522,
"text": "Bland de f\u00e5 som har fullt st\u00f6d finns IBM C.",
"source": "https://sv.wikipedia.org/wiki?curid=1454"
},
{
"id": 44295,
"text": "Denna kom d\u00e5 att byggas som ett hus f\u00f6r sig.",
"source": "https://sv.wikipedia.org/wiki?curid=1478"
},
{
"id": 44050,
"text": "Han var yngste son till Oscar II och Sofia.",
"source": "https://sv.wikipedia.org/wiki?curid=1466"
},
{
"id": 64451,
"text": "En av dem \u00e4r Comosj\u00f6n.",
"source": "https://sv.wikipedia.org/wiki?curid=2381"
},
{
"id": 54966,
"text": "Och Gud sj\u00e4lv skall vara hos dem.",
"source": "https://sv.wikipedia.org/wiki?curid=1876"
},
{
"id": 70908,
"text": "\u00c5r 1973 gick b\u00e5de BRD och DDR med i FN.",
"source": "https://sv.wikipedia.org/wiki?curid=2634"
},
{
"id": 9470,
"text": "Den mest k\u00e4nda collien p\u00e5 film och TV \u00e4r Lassie.",
"source": "https://sv.wikipedia.org/wiki?curid=354"
},
{
"id": 40510,
"text": "Den \u00e4r n\u00e5got lik en b\u00e4ver.",
"source": "https://sv.wikipedia.org/wiki?curid=1349"
},
{
"id": 10573,
"text": "De valde nio arkonter f\u00f6r ett \u00e5r i taget.",
"source": "https://sv.wikipedia.org/wiki?curid=389"
},
{
"id": 26468,
"text": "I denna sorg drog sig Joakim undan i \u00f6knen d\u00e4r han fastade i fyrtio dagar.",
"source": "https://sv.wikipedia.org/wiki?curid=905"
},
{
"id": 64258,
"text": "Det \u00e4r vanligt med av tre ungar men en kull kan best\u00e5 av en till fyra ungar.",
"source": "https://sv.wikipedia.org/wiki?curid=2371"
},
{
"id": 60665,
"text": "N\u00e4r Zeus vuxit upp tog han strid med sin far.",
"source": "https://sv.wikipedia.org/wiki?curid=2099"
},
{
"id": 68751,
"text": "Det var ofta \u00e5rets enda bad.",
"source": "https://sv.wikipedia.org/wiki?curid=2562"
},
{
"id": 56557,
"text": "Han hade god tro p\u00e5 Gud.\"",
"source": "https://sv.wikipedia.org/wiki?curid=1961"
},
{
"id": 16932,
"text": "Den vars yrke \u00e4r att f\u00e5nga fisk \u00e4r fiskare.",
"source": "https://sv.wikipedia.org/wiki?curid=585"
},
{
"id": 63795,
"text": "Hans oro visade sig i hans beteende mot Nils Sture.",
"source": "https://sv.wikipedia.org/wiki?curid=2342"
},
{
"id": 45317,
"text": "Han dog p\u00e5 v\u00e4g till Rom i Kilikien \u00e5r 117.",
"source": "https://sv.wikipedia.org/wiki?curid=1527"
},
{
"id": 43939,
"text": "De har \u00f6ppna \u00f6gon och h\u00e5r p\u00e5 kroppen.",
"source": "https://sv.wikipedia.org/wiki?curid=1461"
},
{
"id": 12995,
"text": "Olof skall dock ha d\u00f6tt ung och Erik blivit ensam kung.",
"source": "https://sv.wikipedia.org/wiki?curid=473"
},
{
"id": 60939,
"text": "Zilog Z80 \u00e4r en CPU fr\u00e5n Zilog.",
"source": "https://sv.wikipedia.org/wiki?curid=2110"
},
{
"id": 7951,
"text": "De som r\u00e4knas upp h\u00e4r \u00e4r bara n\u00e5gra exempel.",
"source": "https://sv.wikipedia.org/wiki?curid=305"
},
{
"id": 40716,
"text": "Se ocks\u00e5 N\u00e4ssj\u00f6 IF Fotboll.\"",
"source": "https://sv.wikipedia.org/wiki?curid=1362"
},
{
"id": 5257,
"text": "Ett av dem finns p\u00e5 Moderna museet.",
"source": "https://sv.wikipedia.org/wiki?curid=183"
},
{
"id": 4126,
"text": "En hink eller tv\u00e5 \u00e4r ocks\u00e5 bra att ha.",
"source": "https://sv.wikipedia.org/wiki?curid=120"
},
{
"id": 52377,
"text": "Nu kan jag f\u00e5 v\u00e4nta i m\u00e5nader\".",
"source": "https://sv.wikipedia.org/wiki?curid=1779"
},
{
"id": 64905,
"text": "If that is the charge, I stand guilty, and I am proud of it.\"",
"source": "https://sv.wikipedia.org/wiki?curid=2394"
},
{
"id": 18478,
"text": "I regel tycks den g\u00e5 ur v\u00e4gen f\u00f6r dem.",
"source": "https://sv.wikipedia.org/wiki?curid=643"
},
{
"id": 27539,
"text": "This is my last and final will.",
"source": "https://sv.wikipedia.org/wiki?curid=935"
},
{
"id": 5278,
"text": "Tiden fram till jul r\u00e4knas ned p\u00e5 olika s\u00e4tt beroende p\u00e5 tradition.",
"source": "https://sv.wikipedia.org/wiki?curid=184"
},
{
"id": 67071,
"text": "Man kan genom \u00f6ppningen se rakt upp i en del av tornet.",
"source": "https://sv.wikipedia.org/wiki?curid=2469"
},
{
"id": 26115,
"text": "S\u00e5 har det dock inte alltid varit.",
"source": "https://sv.wikipedia.org/wiki?curid=902"
},
{
"id": 5639,
"text": "En stor h\u00e4r under Narses ryckte fram mot Rom och slog i tv\u00e5 slag goterna.",
"source": "https://sv.wikipedia.org/wiki?curid=195"
},
{
"id": 5304,
"text": "\"Men du tog ju ett glas vin till maten.\"",
"source": "https://sv.wikipedia.org/wiki?curid=187"
}
]
}
]
}

File Metadata

Mime Type
text/plain
Storage Engine
blob
Storage Format
Raw Data
Storage Handle
8927764
Default Alt Text
sample_output_20210318.json (15 KB)

Event Timeline