Nov 192014
 

I dag modtog jeg bladet "Energi & Bolig" fra mit el-selskab seas-nve. I lederen anfører Adm.Dir. Jesper Hjulmand forskellige tal om energiproduktion fra vindmøller og husstandssforbruget. Han skriver blandt andet

"Sidste år blev en tredjedel af Danmarks samlede elforbrug produceret af vindmøller" og "Havvindmølleparken Rødsand 2 [...] producerer 830.000.000 kWh - [svarende til] årsforbruget i 200.000 husstande." (ref. Energi & Bolig nr 34/dec. 2014 - Leder, side 2)

Dette er alt sammen meget godt, men der er 2 ting der ikke fremkommer af denne artikel.

  1. El-produktionen fra vindkraft korrelerer ikke med el-forbruget i Danmark. Vinden blæser når den blæser og det er uanset om der er brug for el eller ej. En analyse af korrelationen fra REO.DK mellem el produceret fra vindkraft og el forbrugt viser ingen korrelation mellem disse to størrelser. Korrelationen er -0,08 eller på jævnt dansk - der er ingen sammenhæng mellem elproduktion fra vindkraft og forbruget af el i Danmark.
    Det faktiske bidrag fra vindkraften til el-forbruget i Danmark er derfor ikke en tredjedel som anført i lederen, men lavere end det, pga. eksport af overskudsproduktion til andre lande.
  2. Når vi EKSPORTERER (fx om natten, hvor elforbruget er lavt) overskuds-el er prisen oftest lav fordi behovet også er lavt andre steder. Når vi IMPORTERER el (fx når det er vindstille) er prisen oftest høj, bl.a. fordi vejrliget omkring os er tilsvarende (ingen vind = ingen overskudsproduktion).
    Dette betyder netto at vi eksporterer billig el på ét tidspunkt og køber dyr el på et andet. Når vindkraftproduktionen vokser i Danmark, vil det totale overskud/underskud vokse og vi vil ende op med at betale MERE for en kWh el!
Jan 052014
 

Samlingen af maskinen gik forholdsvist smertefrit, der medfølger en ganske god manual på en ca. 80 sider der beskriver samling og test af maskinen. Samling tog ca. 4 timer, hvilket stemmer overens med manualens bud.

Caveats

Følgende er mine erfaringer fra samling af maskinen.

  • Kassen er laserskåret i birketræsfiner. Bemærk der sidder et lag beskyttelsespapir på den ene side af træet der beskytter mod varmepåvirkning. Det kan ses på det første billed nedenfor. Fjern dette papir inden maskinen samles. Det sidder så godt fast at jeg overså det i første omgang og brugte en del tid på at skille huset ad og fjerne papiret bagefter!
  • Termosensoren i heatblokken har et hårfint, tyndt kabel. Pas godt på ikke at knække dette kabel under montagen.
  •  Det varmebeskyttende filt til heat blokken var ikke særlig præcist skåret ud! Hvis du har noget til overs selv eller kan skaffe noget i samme tykkelse vil jeg anbefale at lave det bedre selv. Det kan  have en effekt på varmeafgivelsen.
  • Software downloades fra http://openpcr.org/use-it (Fejl i manualen! Der står http://openpcr.org/start). Softwaret er testet og fungerede både til Windows og til Mac.

Heater lid

Låget indeholder et varmeelement der skulle kunne forhindre kondensation under brug. Varmeelementet virker, men jeg har ikke testet værdien af det, da jeg ikke har nogen eppendorf tubes jeg kan teste på endnu. Højden af varmelementet over heat blokken justeres med det sorte håndtag. Hvis varmeelementet ikke kører jævnt op og ned skyldes det sandsynligvis at en plastic spacer (afstandsskive) går imod en af de fjederbelastede skruer på indersiden.

pcr heater lid pcr heater lid - justeringsskrue

Køleunit

Køleunitten er ligetil. De fire fastgøringsarme har nogle plasticbeslag der skal fjernes. Dette ordnes nemt med en skævbider.

openPCR - køleunit

 

Heat blok

Varmen til blokken styres af et Peltierelement. Hele blokken er en sandwich af syv lag, der skal sættes sammen korrekt. Brug tid hér til at få sat det ordentlig sammen, da det ikke kan skilles let ad igen (de varmeoverførende Thermal pads vil så skulle udskiftes!).

openPCR - heatblok

 

Display

LCD skærmen monteres i hullet i toppladen. Sørg for at vende display og kabel korrekt.

openPCR - med display

 

Final assembly

PSU og Arduino monteres i bunden af kassen. Der er mange kabler at holde styr på, husk igen at passe på ikke at knække det tynde kabel fra sensoren! Med de leverede kabelholdere er det forholdsvist enkelt at styre alt, så airflow i kassen ikke hindres, og så kablerne sidder ordentlig fast.

openPCR - final assembly

 

Software download og test

Software downloades fra http://openpcr.org/use-it (Fejl i manualen! Der står http://openpcr.org/start). Softwaret er testet og fungerede både til Windows og til Mac. Af én eller anden grund får adobe AIR et suffix "dmg.mdlp" tilføjet ved download. Derfor starter filen fejlagtigt op i MATLAB på Mac! Ret suffix til .dmg og installationen kører som forventet.

Software openPCR indeholder et program til test af maskinen (A simple test). Programmet kører fint og viser at både heat lid og heat blok varmer / køler som det skal. Et enkelt minus ved softwaren er at det ikke er muligt at vise en temperaturprofil under/efter kørslen. Det kunne være nyttigt til dokumentation af forsøg..

 

openPCR - testet og færdig!

Next steps..

Hvad så nu? Jeg overvejer stadig hvilke fantastiske og spændende eksperimenter der skal udføres. Forslag modtages gerne.

Samtidig må jeg erkende at det er 20 år siden jeg sidst lavede laboratorieeksperimenter i biokemi, og jeg er sikker på udviklingen ikke har stået stille siden da! Så jeg er også på udkig efter nye manualer og protokoller for håndtering af DNA.

Jan 052014
 

Kort efter Nytårsaften modtog jeg min openPCR maskine fra USA. Her er et par billeder og refleksioner over det modtagne. Samling af selve maskinen blev klaret på 3 - 4 timer og er beskrevet her.

Hele herligheden kom i en enkelt papkasse forsvarlig indpakket. Kassens indhold er delt i et antal mindre kasser (der samles til maskinens hovedkomponenter) der gør det forholdsvist nemt at finde delene når de skal bruges. Det ses straks at strømkablet IKKE passer til en almindelig dansk stikprop med 2 eller 3 ben! Hvis du har et kabel tilovers fra en gammel PC, vil du nok finde at det passer til en openPCR maskine. Manualen er pæn og overskuelig, og kvaliteten af komponenter (PSU, køler, arduino etc) er god. Og nu da indholdet er pakket ud, lad os gå i gang med samling og test!

openPCR - pakkenopenPCR - åbnetopenPCR - indholdet

Oct 062013
 

Hvordan finder et website ud af, hvad der interesserer DIG på basis af andres likes eller anbefalinger? Problemet er ikke trivielt. Der er mange måder at gøre det på og mange af dem der anvendes derude, på websites, er forkerte.

Problemet kan anskues på denne måde: Et website sælger widgets og gadgets. Når folk har bestilt noget, vil ejeren gerne foreslå kunden at købe et andet produkt ved siden af, som er anbefalet af tidligere kunder. Kunder har mulighed for at tilkendegive "positiv" eller "negativ" anbefaling af deres køb og der er masser af data til rådighed i salgsdatabasen. Hvilke produkter skal firmaet anbefale til sine kunder?... tænke, tænke.. Ejeren tager et møde med IT-afdelingens statistiker.

1. ide: "Produktet med fleste positive "likes" må være det bedste", foreslår ejeren. "Svaret er desværre FORKERT", siger statistikeren, og her er hvorfor. Antag at widget B har 10000 anmeldelser (både positive og negative) hvoraf 4500 er positive. Widget A derimod har 100 anmeldelser hvoraf 80 er positive. Det vil sige at A får positive anmeldelser i 80% af tilfældene, mens B kun får positive anmeldelser i 45% af tilfældene. På trods af dette vil denne logik anbefale widget B til kunden.

2. ide: Ejeren tænker sig om siger "Så må det være procenten af positive anmeldelser, der giver et korrekt billede.." Svaret er desværre OGSÅ forkert", svarer statistikeren. Antag at Widget C har 99 positive anmeldelser ud af 100, mens D har 2 positive anmeldelser ud af 2. Widget C har klart de bedste anbefalinger men widget D vinder fordi den tilfældigvis endnu ikke har fået en eneste negativ anmeldelse. Firmaets statistiker fortsætter "Denne model er en maximum likelihood estimator (MLE) og den er stærkt afhængig af at der er et tilstrækkeligt antal anmeldelser på alle produkter for at give et sikkert grundlag for beregningen og anbefaling af produkterne."

3. ide: "OK", siger ejeren, "vi lever af de nye produkter så det er vigtigt at vi får dem med så godt som muligt. Kan vi lave noget der korrigerer for at nye produkter kun har meget få anmeldelser?". "Vi kan bruge en Laplace estimator", siger statistikeren, "her tager vi hensyn til både de opsamlede data OG korrigerer resultatet for mulige positive og negative anmeldelser. "OK, lav et eksempel" afbryder ejeren, der har det som om hans hoved er ved at eksplodere med statistik. Statistikeren fortsætter "MLE  udtrykkes ved sandsynligheden p = s / n hvor s er antallet af positive anmeldelser og n er det samlede antal anmeldelser. Laplace estimatoren korrigerer ved til det samlede antal observationer n at tillægge én af hver mulige udfald. Da der i dette tilfælde kun er to muligheder - en positiv eller en negativ anmeldelse - bliver Laplace estimatoren p´ = (s+1)/(n+2)". Statistikeren laver en tabel.

Widget A B C D
Likes (s) 80 4500 99 2
Total (n) 100 10000 100 2
p =s/n [MLE] 80/100=80% 4500/10000=45% 99/100=99% 2/2=100%
p´=(s+1)/(n+2) [Laplace] 81/102=79,4% 4501/10002=45% 100/102=98% 3/4=75%

"Laplace estimatoren rangordner bedst, men et konfidensinterval ville være bedre", siger statistikeren. "Widget A og D har 79% henholdsvis 75% score, men vi kan faktisk beregne et tal der angiver 95% sandsynlighed for, hvad produktets score er. Jeg tror du skal tage en kop kaffe mens jeg skriver Wilsons formel op."

{{1}\over{1+{{1}\over{n}}z^{2}_{\alpha/2}}}*[\hat{p}+ {z^{2}_{\alpha/2}\over{2n}} \pm z_{\alpha/2}*\sqrt{([\hat p(1-\hat p)+z^{2}_{\alpha/2}/4n]/n)} ]

"Denne formel", fortsætte statistikeren, "angiver et konfidensinterval for scoren for hvert enkelt produkt og kan beregnes. \hat{p} er andelen af positive anmeldelser, z_{\alpha/2} er (1-\alpha/2) kvartilen af en standard normalfordeling, og n er det totale antal observationer." Statistikeren fortsætter tabellen. "Et estimat på scoren er således ganske forskellig, især for widget D, der har så få anmeldelser indtil nu".

Widget A B C D
p´=(s+1)/(n+2) [Laplace] 81/102=79,4% 4501/10002=45% 100/102=98% 3/4=75%
95% konfidensinterval nedre værdi 71% 44% 95% 34%

Tal og bogstaver danser foran ejerens øjne. "OK, implementér det, med mindre det koster en bondegård i ekstra computere og databaser", sluttede han. "Will do", svarer statistikeren, "jeg ændrer koden sammen med vores SQL-ekspert."

Efterskrift
Disse beregninger kan nemt implementeres i et database udtræk og præsenteres i den korrekte rangorden efter mest sandsynlige positive anbefaling. Dette rejser dog et nyt problem, nemlig om nye kunder (som gennemsnit betragtet) har de samme præferencer som de kunder som hahandlet før. Eller sagt på en anden måde : Vil f.eks. en kunde fra Odense have de samme præferencer som en kunde fra København? Er der forskel mellem mand og kvinde? og så videre og så videre. Dette nærmer sig BIG DATA analyse og jeg håber jeg kan få tid til at angribe dette ved en anden lejlighed.

*** Noter ***

Ranking af definitioner på ordet "lily" på urbandictionary.com - 6/10/2013

rank Pos neg pos-neg p interval Wilson rank
1 3196 426 2770 88 % 90-87 % 2
2 3071 1257 1814 71 % 74-68 % 3
3 1752 853 899 67 % 72-63 % 5
4 1322 515 807 72 % 78-65 % 4
5 819 42 777 95 % 98-87 % 1
6 1230 577 653 68 % 76-59 % 7
7 1049 446 603 70 % 80-59 % 6

Det ses tydeligt at urbandictionary.com benytter model 1 (pos-neg). Bemærk 5.position der har positive tilkendegivelser i 95% af tilfældene og har det højeste interval, men altså ligger langt nede på listen...

Referencer:

1. This post was inspired by information from evanmiller.org. I am also indebted to Mr. Millers kind email correspondence on details in his blog.

2. Binominal proportion confidence interval(Wikipedia). Wilsons formel og andet vedr. estimering på binominale fordelinger.

Opdateringer

08 oktober 2013. opdaterede sidste tabel med konfidensintervaller.

Apr 302013
 

I denne og et par efterfølgende posts vil jeg beskrive designet for det der måske er verdens mindste computer. Specifikationerne er små og få, og ligeså er de komponenter der skal til at bygge den. Selv om der måske kun er begrænset anvendelighed for denne computer vil den ikke desto mindre give et godt indblik i, hvordan computerlogik konstrueres. Jeg vil også med afsæt i dette komme ind på, hvordan (silicium baserede) computere ikke skaber information, men kun kan smide information væk... Underligt som det nu kan lyde er dette ganske nyttigt alligevel og jeg vil drage nogle paralleller til hvordan vores hjerne (carbon-computeren) virker.

Specifikationerne for designet er -

  • 3 bit input - 1 databit og 2 bit til instruktionen
  • 3 bit output - 1 databit og de resterende 2 bit output bruges til et instruktionsregister. Mere herom senere.
  • 4 unikke instruktioner til at manipulere input med og generere output.
  • Logikken kan bygges med 2 (to!) stk integrerede kredse - 1 stk 2-input NAND chip og 1 x 3-input NAND chip. Strømkreds, input givere og output givere er ikke med i designet men skulle kunne laves enkelt af de fleste.

Hvad er en computer?
Definitionen fra wikipedia er passende i denne henseende:

"A computer is a general purpose device that can be programmed to carry out a finite set of arithmetic or logical operations."

Vi vil kigge på de logiske operationer der kan komme på tale med vores 1-bit computer, og se hvorfor termen "finite set" (endeligt antal) er vigtigt.

Da vi har 1 bit at gøre godt med (input = 0 eller 1) er spørgsmålet hvad vi kan gøre med denne information? Jeg vil sætte 4 systemer op og vise at dette er de eneste 4 systemer der er mulige, dvs vi har et endeligt antal logiske operationer. I det efterfølgende vil jeg benævne input bits med bogstaver a,b,... I 1-bit computerens tilfælde har vi kun input på a. Output benævnes med f.

  • Uanset hvilket input a er givet, smid tallet væk og sæt output f = 0. Vi vil kalde denne model S(0) af årsager der bliver klar om lidt.
  • Hvis a=0, sæt f=1 og hvis a=1, sæt f=0. Vi kalder denne model S(1). Dette svarer til den logiske operation f=NOT(a).
  • Sæt f=a. Vi kalder denne model S(2). Dette svarer til en simpel overførsel af input bitten til output.
  • Uanset hvilket input a er givet, smid tallet væk og sæt output f = 1. Vi kalder denne model S(3).

Dette er de eneste 4 systemer der kan laves med en 1-bit computer! Lad mig stille tallene lidt anderledes op, så det ses hvorfor.

input
a   1 0
Model S(x)  Output Operation
S(0) f= 0 0 f=0
S(1) f= 0 1 f=NOT(a)
S(2) f= 1 0 f=a
S(3) f= 1 1 f=1

Tallene i venstre kolonne svarer til værdien af det binære tal til højre udtrykt i vores 10-talssystem. Givet der kun er 1 bit til rådighed til input (a=0 eller a=1) ses det umiddelbart at der ikke er andre operationer der kan producere andre unikke output, end dem der allerede er skrevet her.

Uden at komme nærmere ind på detaljerne kan det siges at disse logiske operationer forholdsvist nemt kan implementeres med diskrete komponenter.

  • S(0) implementeres ved at trække output f til Nul i en strømkreds.
  • S(1) implemeteres ved at sende input a gennem en inverter til output f.
  • S(2) implementeres ved at sende input a gennem en buffer til output f.
  • S(3) implementeres ved at trække output f til V+ i en strømkreds.

Problemet med disse systemer er dog at de er hardwiret til at udføre én og kun én logisk operation. Det ville være mere praktisk, hvis vi kunne bygge en computer der kan udføre alle 4 forskellige operationer. Det er muligt og det vil jeg beskrive i næste post.

 

 

 

Apr 202013
 

 

I Danmark er ytringsfriheden sikret gennem Grundlovens §77, men på trods af dette er adgang til visse medier på internettet blokeret. Dermed er dansk praksis i samme liga som f.eks. Kinas, hvor hjemmesider (udenfor Kinas grænser) blokeres af den kinesiske regering fordi de ikke kan lide dem af den ene eller anden grund, eller det der gives udtryk for på disse sider.

§ 77. Enhver er berettiget til på tryk, i skrift og tale at offentliggøre sine tanker, dog under ansvar for domstolene. Censur og andre forebyggende forholdsregler kan ingensinde påny indføres.

Jeg vil her forklare lidt om baggrunden for denne praksis, hvad den danske stat evt. ønsker at 'beskytte' os fra,  og hvorfor det ikke virker, fordi enhver med et minimum af teknisk viden kan omgå blokeringerne. Den danske praksis ender derfor med kun at være en hindring for almindelige brugere, og ikke en måde at forhindre adgang til ulovlige websites af den ene eller anden karakter. Jeg vil straks gøre det klart at dette indlæg IKKE er en opfordring til ulovligheder på nettet, men udelukkende et forsøg på at vise, hvorfor den danske fremgangsmåde kun har negative effekter for almindelige netbrugere og ikke kan forhindre nogen som helst i at tilgå et blokeret website, hvis de skulle have disse hensigter.

Internetkontrollen (censur) i Danmark sker vha. såkaldt DNS-blokering. DNS-blokering svarer i korte træk til, at hvis man forsøger at ringe til et bestemt telefonnummer, stilles man via sit telefonselskab om til en telefonsvarer der siger at abonnenten ikke kan nås, fordi vedkommende har lavet noget ulovligt. Hvis man forsøger at gå ind på en internetside, der er DNS-blokeret vil man tilsvarende f.eks. få følgende meddelelse, der kommer fra internetudbyderen og ikke fra det søgte website:

 

STOP

TDC har spærret for adgangen til www.thepiratebay.se. Retten har ved fogedforbud af 9. juli 2012 pålagt Telenor at hindre sine kunders adgang til ovennævnte side, da der på siden formidles adgang til materiale, der krænker ophavsretten. På baggrund af denne kendelse har TDC i overensstemmelse med aftale i Teleindustrien spærret for adgangen til siden. TDC har ikke foretaget nogen registrering af dit besøg på denne side.

TDC

 

Tre emner trækkes ofte frem når der tales om internetblokering, og selv om blokeringen har et ædelt formål, virker den danske DNS-blokering ikke, fordi enhver med ønsket om at omgå blokeringen kan gøre dette på mindre end fem minutter. Lad os først se på det, som DNS-blokeringen forsøger at forhindre og derefter hvorfor det ikke virker.

  • Download og deling af opretshavsligt materiale.  Thepiratebay.se er blokeret fordi dette website har været brugt som server og deling af musik/film der har været opretshavsligt beskyttet. Jeg har fuld forståelse for at kunstnere skal have penge for at andre nyder deres kunstværker. Problemet er i denne sammenhæng dog at thepiratebay.se også har masser af ANDET indhold der ikke er ulovligt kopieret og uploadet. Hvis man som mig er interesseret i 3D-printerteknologi resulterer DNS-blokeringen i at jeg ikke kan få adgang til alle de filer og designs der er lagt ud til deling fuldt lovligt af andre, der også er interesseret i 3D-printerteknologi.
  • Børnepornografisk materiale. Der bør efter min mening gøres noget MEGET MERE EFFEKTIVT ved dette problem end at indskyde et filter, der kan omgås på fem minutter. Rigspolitiet og organisationen Red Barnet er indgået i et samarbejde om at blokere et antal af sites, der indeholder (potentielt) børnepornografisk materiale. Problemet med denne tilgang er dog tydelig:
    (1) Det pornografiske materiale er stadig tilgængelig for personer der ikke befinder sig bag en dansk internetudbyder. Børnene er derfor ikke beskyttet for yderligere fornedrelse ved at andre kan kigge på materialet. Det svarer lidt til at stikke hovedet i sandet og tro at problemet er forsvundet. Desuden har harddisken.dk i et program dokumenteret, hvorledes private aktører har formået at lukke flere sites i løbet af få dage, end politiet har formået over flere måneder.
    (2) Registret over blokerede sites administreres af Rigspolitiet og er ikke offentligt tilgængeligt. Et website kan tilføjes til listen uden rettergang eller domsfældelse. En liste over 3863 blokerede sites er tilgængelig på wikileaks og altså ikke hemmelig længere. Det er mindst én gang sket at Politiet uberettiget har lukket for et website og måtte undskylde for det bagefter.
    (3) Med mindre man mener at vores skandinaviske medmennesker i Norge og Sverige er mere interesserede i børnepornografisk materiale, er der noget helt galt med filteret. Tilsvarende filtre i Norge og Sverige blokerer henholdsvis 10000 og 20000 henvisninger hver dag (2005 tal). I danmark blokeres dagligt 2700 forsøg på tilgang til blokerede sider (tal fra 2008).
  • Formidling af (ulovlig?) medicin på nettet. Lægemiddelloven §7 giver kun ret til forhandling og udlevering af medicin i Danmark med en markedsføringstilladelse. Uden markedsføringstilladelse er det forbudt at forhandle og udlevere medicin. Det første eksempel på blokering af et udenlandsk webfirma der sælger medicin er dokumenteret. Som for de to andre eksempler ovenfor har DNS-blokering ingen som helst effekt overfor personer der skulle have til hensigt at skaffe f.eks. anabolske steroider eller andre medikamenter uden recept. Hvis man er villig til at løbe risikoen ved at sælge eller anvende dopingmidler er man sandsynligvis fuldstændig ligeglad med at man 'overtræder' et fogedforbud mod at besøge en udenlandsk webside... Desuden resulterer en ukritisk blokering af et helt website naturligvis også i, at det ikke er muligt at bestille andre (fuldt lovlige) varer fra websitet, og dette er (efter min mening) en hindring af varernes fri bevægelighed og derfor i strid med EU-lovgivningen.

Hvor er vi på vej hen?
Den danske praksis er flere steder kritiseret for at være en glidebane til blokering af f.eks. poker- og andre gamblingsites udenfor dansk lovgivning.

DNS-blokering er sågar anvendt i en fogedretssag mod et website ved navn www.homelifespain.com, fordi mæglerkæden Home åbenbart mener det er en varemærkeovertrædelse at anvende ordet "home"...  Fogedretten har udstedt krav om at internetudbyderen Telenor (og dermed indirekte alle andre udbydere i Danmark) blokerer for adgang til denne side.

Hvorfor er den danske DNS-blokering virkningsløs?
Jeg påstod ovenfor at enhver med et minimum af teknisk viden på mindre end 5 minutter kan omgå den danske DNS-blokering. Jeg vil her skitsere 3 måder. Da det jo ikke er med hensigt at opfordre til ulovligheder er dette ikke en teknisk How-To vejledning.

  1. Installer og brug din egen DNS-server. selv om det måske er lidt for avanceret for de fleste, er der intet til hinder for at installere en DNS-server på en computer i stedet for at anvende internetudbyderens DNS-server. Dette kan desuden spare dig for et par millisekunder, hver gang der skal slås op i DNS-tabellen (hvilket kan ske mange gange på en enkelt side ved fx. sider fyldt med billeder, reklamer, trackers, bots og andet 'spam'). At køre sin egen DNS-server sikrer naturligt også imod udfald ved en tredieparts  DNS-server.
  2. Anvend en tredjeparts DNS-server der ikke er kontrolleret af en dansk internetudbyder. Denne mulighed ligger lige for, hvis man har adgang til at rette i computerens/browserens internet settings. Google public DNS er én af disse services, openDNS er en anden. Der er desuden performance og sikkerhedsrelaterede grunde til at overveje at skifte fra internetudbyderens DNS-service til en anden, så dette er absolut én ting der er nyttigt at overveje. Hvis man ikke har administratoradgang til computeren kan der dog være policies der forhindrer én i at lave disse ændringer.
  3. Anvend en TOR-browser fra en USB-disk. Tor-projektet (kort for The Onion Ring) har Tor Browser Bundle, der sikrer brugerens anonymitet på nettet ved at omdirigere internettrafikken mellem et netværk af Tor-servere. Det er derfor umuligt for internetudbyderen at se, hvor computeren befinder sig og DNS-blokering er ikke relevant. TOR er udviklet af US Navy med det formål at beskytte regeringens kommunikation. For andre (aktivister, journalister, firmaer etc der ikke ønsker at kunne spores) forefindes de samme muligheder for internet anonymitet. Tor er baseret på Firefox browseren så de fleste vil finde denne ganske lig andre browsere at anvende.
    I sagens natur må ip-adresserne på Tor-netværket være tilgængelige for brugerne af systemet, og visse lande gør alt for at begrænse adgangen til Tor-netværket. Der foregår en kontinuerlig kamp mellem totalitære stater og aktivister der f.eks. ønsker at skaffe eller tilvejebringe information om menneskeretsovertrædelser. Jo flere der anvender Tor, desto sværere vil det være for dem, der praktiserer censur, at forhindre det. Ud fra et ideologisk synspunkt kan det derfor være fornuftigt at overveje om man skal være del af dette projekt og hermed hjælpe andre folk, der i endnu større grad end danskere er udsat for internetcensur.

 

 

Påske bryg

 Brygning  Comments Off
Mar 252013
 

Så kom fermenteringen i gang! Dette er kun en kort status på brygget, der blev sat over søndag 24. marts 2013.

Efter en sløv start på gæringen er den nu efter 1 døgn kommet i gang som det ses af vedlagte videoklip . Enjoy.

Brygget blev lavet med baggrund i en recept fra Maltbazaren.dk (Påskeøl). Jeg vender snarest tilbage med flere detaljer.

 

Recepten

Profilen ingredienser
Mængde 20 liter Pilsner malt 4300 g
Alkohl 7 % Munich malt 800 g
Farve 23 EBC Biscuit malt 300 g
IBU 27 Aroma malt 200 g
O.G. 1.065 Black malt 40 g
F.G. 1.012 Northdown humle 30 g
Hersbrucker humle 15 g
Protafloc 1/2 tablet
Gær WLP 011
Alle ingredienser købt i Maltbazaren

Valsning

Alt malt blev leveret blandet i én pose. Valsningen tog en time og gav en god blanding af skaller og findelt malt.

Mæskning

  1. 14.7L vand opvarmet til 73 gr.C blandet med den knuste malt, target temperatur=64gr.C. pH målt = 5.0.
  2. Enzympause 64gr.C i 75 min. Iodtest normal - ingen stivelse tilbage i malten.
  3. Hæve temperaturen til  76 gr.C (rampe 1gr.C/min).
  4. Afmæskning 76gr.C i 10 min.

Urtseparation

Der skal anvendes ca. 15 liter vand @76 gr.C til sparging etc.

  1. Den falske bund dækkes med  varmt vand.
  2. Overførsel af masken fra kogekarret.
  3. Cirkulation over filterbunden indtil urten er klar. Jeg fik desværre trukket lidt for hurtigt af så urten var noget uklar i urtkedlen.

Urtkogning

tid
0 min start kogning
30 min humle tilsat
45 min aromahumle tilsat
90 min kogning slut.

Whirlpool og Urtkøling

Ved omrøring i den kogende urt skabes en whirlpool effekt der samler humlen og hot break i midten af urtkedlen. Urten køles samtidig til under 90gr.C inden overførsel (aht. min urtpumpe der ikke kan klare 100gr.C). Jeg anvender en pladekøler med almindelig koldt vand fra hanen i modstrøm. Med en fornuftig lav temperatur på kølevandet (under 10gr.C) kan urten køles til gæringstemperatur og samtidig pumpes til gæringsbeholder på 5 minutter.

Gær og iltning

i 25L plastbeholdere kan urten beluftes ved simpel omrystning af den halvfyldte beholder. Ved større batche har jeg en luftpumpe der kan levere steril luft. Jeg anvender vådgær fra Whitelabs der kan doseres direkte uden gærstarter.

Gæring

Trin Temperatur
Primær gæring stuetemperatur
Sekundær gæring sub-stuetemperatur (12-15gr.C)

Jeg prøvesmagte på dag 6, hvor der var en tydelig diacetylsmag. Diacetylen var væk da gæring sluttede efter dag 17, hvor FG havde nået målet.

Tapning

Øllet blev fyldt på 0.5L brune flasker der var steriliseret med kogende vand. Der blev tilsat 6 ml sukkeropløsning (136 g i 250ml vand) for eftergæring på flasken for udvikling af CO2. Recepten anbefaler 10 ugers (!) modning på flaske, gerne mere. Udbyttet blev totalt 33x0.5L + diverse rester der er drukket ^_^

 

Mar 212013
 

I tirsdag for en uge siden (14. marts eller 3/14 i engelsktalende lande) var det π (pi) dag. π er forholdet mellem en cirkels diameter og dens omkreds og har en værdi ca. lig med 3,14... og deraf fejringen på denne dag! Du vil sikkert huske tallet fra skolens matematiktimer og mange steder dukker det mærkelige tal π op. F.eks i udregningen af en cirkels areal = π*R2, hvor R er cirklens radius. Omkredsen af en cirkel er 2*π*R, osv.

Grækeren Arkimedes fandt den tilnærmelsesvise værdi 22/7 (3,14285...) allerede i oldtiden. Det gjorde dem store hovedbrud at de ikke kunne finde en eksakt værdi for π, fordi deres matematik var baseret udelukkende på heltal (..., -2,-1,0,1,2,... osv.). π kan ikke skrives som en brøk af to heltal selvom der er mange "smukke" tilnærmelsesvise værdier - fx 355/113 . Bemærk symmetrien i tæller og nævner, der giver et tal 3,1415929... der er præcis ud til 6. decimal efter kommaet. At π ikke kan skrives som en brøk af to heltal betyder det er et irrationelt tal og er dermed i familie med en række andre kendte tal:

Bemærkelsesværdige irrationelle tal:

  • π = 3.14159265...
  • Eulers tal e = 2,71828...
  • Det gyldne snit φ = 1,61803...
  • √2 = 1,41421...

Nu vil mange sikkert synes at π er et cool tal, men der er faktisk et, der er mere cool, nemlig τ (tau) som er 6,28318530...! Tau er forholdet mellem en cirkels radius og dens omkreds. "Og hvad så?" vil du sikkert tænke. "Radius er jo det halve af diameteren, så derfor er  τ jo bare 2*π?". Det er korrekt observeret, men kig på formlerne angivet ovenfor. Falder det dig ind at man har defineret π ud fra cirklens diameter D, men i udregninger anvender vi radius R i stedet for ?? Jeg foreslår du tager et kig på denne fornøjelige og forståelige video der giver en forklaring.

Det der fik mig overbevist om det über coole ved τ er at arealet af en cirkel er A = 1/2 * τ * R2 frem for A = π * R2. Det er fordi der derved ses en sammenhæng med andre kvadratiske formler der går igen overalt i fysik og matematik.

Bemærkelsesværdige kvadratiske formler:

  • En cirkels areal A = 1/2 * τ * R2
  • Den potentielle energi i en udstrukket fjeder E = 1/2 * k * X2
  • Den kinetiske energi af et legeme i bevægelse E=1/2*m*V2.

Jeg ser i hvert fald frem til at fejre tau dag i år, 28. juni (6/28) ;-)

 

 

Feb 102013
 

I to foregående posts har jeg beskrevet hvorledes scatterplot og barchart anvendes til at visualisere sammenhænge mellem data. I denne post vil jeg beskrive Piechartet, der er ideelt til at vise procentvise fordelinger mellem data.

Lad os fortsætte med det oprindelige datasæt. Målet var at undersøge om der er en sammenhæng mellem boligareal og huspris. Med et piechart bevæger vi os nu væk fra dette oprindelige mål. Et piechart er ikke godt til at vise sammenhænge mellem forskellige data (boligareal og huspriser) men er derimod velegnet til at vise fordelinger af en enkelt variabel, f.eks. boligarealer i dette eksempel.

Datasæt huspriser

Vi inddelte tidligere de 17 datapunkter i 4 kategorier og beregner nu den procentvise fordeling i kategorierne. Det ses at data i histogrammet og piechartet har en del til fælles, faktisk er den procentvise fordeling i dette piechart beregnet direkte på baggrund af histogrammet vist tidligere.

Piechart. Pivottabel data

Piechart. Huse til salg

Konklusion.
Et piechart er enkelt at beregne og giver et hurtigt og effektivt overblik over relative forhold mellem data (%). Samtidig må vi også indse at vi har flyttet os længere væk fra vores oprindelige data (som vist på scatterplot). Dette er prisen for at abstrahere data.

Et andet eksempel hvor piecharts er rigtig gode er f.eks. visualisering af stemmeprocenter ved et valg. Her tabes der ikke meget information ved at omregne stemmetal til procent, faktisk er det netop stemmeprocenten, der er vigtig.

 

 

 

Feb 102013
 

I en foregående post om Scatterplots viste jeg en enkel teknik til at se om der er sammenhæng mellem data. I denne post ser vi på barcharts som en vej til at filtrere støj ud som oftest ses på et scatterplot. Hvis du bruger ca. 5 minutter på læsning af denne post vil du have tilegnet dig endnu et nyttigt redskab der kan anvendes til ganske mange ting – og forfine de resultater du har opnået ved anvendelse af scatterplots.

I et barchart samles datapunkter i kategorier og der regnes på gennemsnitsværdier. Derved vil "tilfældig støj" i data til en vis grad elimineres (+ går ud mod -) og trends eller sammenhænge kan nemmere ses. Der er dog visse farepunkter at tage vare på - dem behandler jeg senere i denne post. Lad os fortsætte med det oprindelige datasæt. Målet var at undersøge om der er en sammenhæng mellem boligareal og huspris.

Datasæt huspriser

Vi inddeler de 17 datapunkter i 4 kategorier og beregner gennemsnit(note 1) i kategorierne således

kategori range (m2) huse gennemsnit pris
1 114 - 141,75 id#1; 2.496.000kr
2 141,75 - 169,5 id#8;id#6;id#10;id#3; 4.021.000kr
3 169,5 - 197,25 id#2;id#13;id#5;id#4;id#17;id#15;id#16;id#9; 5.196.000tkr
4 197,25 - 225 id#11;id#7;id#14;id#12; 2.496.000kr

 

barchart huspris vs boligareal

Sammenlignes med det tidligere scatterplot  (her) ses følgende:

  1. Grafen er nu mere simpel og overskuelig. Dette er sket på bekostning af at vi har poolet data i overordnede kategorier. Derved har vi filtreret en del af støjen fra, men samtidig har vi afskåret os fra at se en del af informationen vi havde i vores scatterplot.
  2. Grafen underbygger kun delvist at der er en vis sammenhæng mellem pris og boligareal. De største huse (197 - 225 m2) sælges gennemsnitligt billigere  end husene i den lavere kategori (169 - 197 m2). Der er altså stadig indikation af at andre faktorer som f.eks. beliggenhed eller udsigt har indflydelse på prisen.

Farepunkter
Når man laver et barchart på basis af datapunkter er der et antal spørgsmål man må overveje. Disse er:

1. Spørgsmål: Hvor mange kategorier skal jeg lave? Svar: Datasættets omfang skal afspejles i antallet af kategorier. Hvis der vælges for få kategorier går der for meget information tabt. Hvis der vælges for mange kategorier risikerer man at få for meget støj med (for få datapunkter i hver kategori). Et fornuftigt udgangspunkt er at tage kvadratroden af antallet af datapunkter. Dvs. har man 25 datapunkter kan man lave 5 kategorier (5*5=25). Har man 100 datapunkter kan man lave 10 kategorier (10*10=100). 

2. Spørgsmål: Hvor placerer jeg grænsen mellem kategorierne? Svar: Lad data bestemme. Med mindre der er helt åbenbare grunde til at køre med faste intervaller f.eks. 0-20-40-60-80-100, så kig på data. I ovenstående eksempel varierer boligarealet fra 114 til 225 m2. Dette er dermed de ydre grænser. Kategoriernes bredde er (225 - 114 ) / 4 = 27,75 (der er 4 kategorier). Det er meget sandsynligt at der ikke kommer lige mange datapunkter i hver gruppe - det gør ikke noget.

3. Spørgsmål: Hvordan beregner jeg "gennemsnit" i en kategori? Svar: Generelt ville jeg tage det aritmetisk gennemsnit. Dvs. for kategori  2 er gennemsnits huspris = (4.145.000 + 3.995.000 + 4.295.000 + 3.650.000) / 4 = 4.021.000 kr (afrundet til 1000kr). Der er alternativer, fx. at tage medianen (note 2).

Bonusinformation
Histogram. Huse til salg
Afslutningsvis vil jeg nævne et helt specielt barchart, nemlig histogrammet. Et histogram er en simpel optælling af emnerne i de forskellige kategorier, som vist på grafen. Jeg vil overlade til læseren at kontrollere at dette histogram stemmer med det oprindelige datasæt (øverst).

Noter

Note 1. Ordet gennemsnit skal tages lidt løst her. Se note 2.

Note 2.  Medianen er det midterste tal i en ordnet serie. F.eks. er medianen af 114,145,153 = 145 da dette er det midterste tal (definitionen på en median). Hvis der er et lige antal punkter tages gennemsnittet af de to midterste (medianen af 114,145,153,167 er (145+153) / 2 = 149). Medianer er i visse tilfælde at foretrække fordi de er mere robuste overfor datafejl: Medianen af (100,102,103,104,1005) er 103, selv om 1005 sandsynligvis er en fejl. Regnes med aritmetisk gennemsnit fås (100+102+103+104+1005)/5=282,8 hvilket hverken er fugl eller fisk.