Hur kan man systematiskt arbeta med sitt DNA-resultat? Det finns säkert många sätt att göra det på, men här tänkte jag presentera hur jag gör. Jag använder Excel eftersom jag är mest bekant med det, men principerna går även att använda i andra liknande program, så som exempelvis Numbers.
För- och nackdelar
Fördelarna med detta arbetssätt är att du får alla dina DNA-matcher på ett och samma ställe vilket underlättar analyser och detektivarbete. Genom att ha data i en egen Excelfil kan du göra noteringar och djupdyka i kromosompositioner och på så sätt upptäcka intressanta kluster som inte alltid kommer med i klusteranalysverktygen hos leverantörerna.
Baksidan är att du endast får en ögonblicksbild från det datum du laddar ner resultaten. Alla nya DNA-matcher kommer inte med i din sammanställning. Det kan därför vara bra att göra om övningen med jämna mellanrum, men jag ser inte behovet att göra det för ofta.
Tidsåtgång
Själv har jag gjort denna övning en gång i halvåret och det räcker väldigt långt. Visst har det hänt att jag har fått lite högre träffar som hade varit bra att ha med, men ändå valt att avvakta. Det tar ändå lite tid att sammanställa allt. För mig, som är van vid att arbeta med stora mängder data sedan tidigare, tar det ungefär 2 timmar att sammanställa allt. Det är exklusive väntetid att få filerna genererade från respektive leverantör.
Förkunskaper
Du behöver följande förkunskaper:
- Spara om csv-fil till xlsx fil
- Använda text till kolumner (Text to columns)
- Använda funktionen ersätt (Replace)
- Använda formeln leta rad (vlookup)
- Städa bort onödig information så som blankrader
- Frysa översta raden och första kolumnen (freeze panes)
- Lägga till och använda filter
Ladda ner data
Gå till de leverantörer du är testad hos och ladda ner följande data.
DNA-matchningar:
- Family Tree DNA
- My Heritage
Kromosomdata:
- Family Tree DNA
- My Heritage
Skapa en ”Masterfil”
För att arbeta effektivt framöver behöver du föra över all information till ett dokument. Jag rekommenderar att du döper dokumentet något i stil med ”DNA-matchningar ååmmdd” (datumet som du exporterat filerna).
Förbered filerna
Gör följande med samtliga DNA-matchningsfiler:
- Spara om filen från formatet csv till xlsx
- Om all information ligger i första kolumnen, se då till att markera första raden och använd funktionen ”text till kolumner”. Du behöver använda komma som separationskommando.
- Om leverantören inte kan exportera å, ä eller ö kan man byta ut de tecken genom att kopiera det felaktiga tecknet och byta ut mot rätt.
- Om leverantören exporterar även titlarna, så som Mrs. och Mr. Rekommenderar jag att kopiera dessa titlar och ersätta med ingenting ”” för att lättare arbeta med leta rad-formeln (vlookup) senare.
- Högerklicka på fliken, kopiera och byt dokument till din masterfil.
Repetera ovan med dina kromosomdatafiler. Du behöver dessutom göra följande:
Se till data i kromosomdatafilen hänger samman. Så som resultatet levereras har varje DNA-träff för sig och sedan kommer en blankrad för att markera att det är en ny person. Denna blankrad ställer till det eftersom man inte kan filtrera.
- Få raderna att hänga ihop genom att ange ett tecken, exempelvis ”1” eller ”x”, i den första tomma kolumnen till höger. Se sedan till att detta tecken finns med hela vägen från första raden till den sista.
- Lägg till ett filter och sortera A-Ö i kolumnen för kromosom
- Gå längst ner till listan och ta bort blankraderna som endast innehåller det tecken du angivit
Skapa en flik för DNA-matcher
Jag tycker att informationen från FamilyTreeDNA är bäst att utgå ifrån. Det beror främst på att den listan redovisar även vilken haplogrupp en DNA-match har. Det är något som jag brukar föra in i mitt släktträd på mina identifierade DNA-kusiner. Dessutom tycker jag att uppställningen av data, alltså vilken information som visas i vilken ordning, är bäst i FamilyTreeDNAs DNA-matchningslista.
Jag använder FamilyTreeDNA som ”masterflik” i nedan steg:
- Döp om fliken till ”DNA-match” eller liknande för att markera att fliken innehåller DNA-matchningsinformation
- Frys översta raden och DNA-matchningsraden, så att du alltid ser kolumnen och vem din DNA-träff är.
- Ta bort kolumner som inte skapar värde för dina vidare DNA-analyser.
- Kopiera data från de övriga leverantörerna in i fliken ”DNA-match”. Du klistrar in data längst ner där din träfflista från föregående leverantör slutar.
- Det är viktigt att du ser till att samma typ av data hamnar i samma kolumn. Filerna har olika uppbyggnad, så du behöver titta på respektive kolumn innan du kopierar över informationen. Kopiera endast information som du behöver.
- Se till att listan hänger ihop och att du inte skapar blankrader. Du vill kunna sortera och filtrera din lista
- Lägg på filter och sortera som du vill. Exempelvis ”högst andel gemensamt DNA” eller ”högsta andel gemensamt DNA-segment”.
- Radera alla flikar som du har tömt på data. Annars kan de skapa förvirring när du analyserar informationen.
Skapa en flik för kromosomdata
- Använd samma principer för att föra samman allt kromosomdata i en flik. Istället för att döpa din masterflik för kromosomdata till ”DNA-match” kan du använda mer beskrivande ”Kromosomdata”.
- Radera alla flikar som du har tömt på data. När du är klar ska du alltså endast ha två flikar i ditt dokument:
- DNA-matcher
- Kromosomdata
Egna kolumner
För att dokumentera mitt analysarbete brukar jag lägga in följande egna kolumner:
- Se till data i kromosomdatafilen hänger samman. Så som resultatet levereras har varje DNA-träff för sig och sedan kommer en blankrad för att markera att det är en ny person. Denna blankrad ställer till det eftersom man inte kan filtrera.
- Få raderna att hänga ihop genom att ange ett tecken, exempelvis ”1” eller ”x”, i den första tomma kolumnen till höger. Se sedan till att detta tecken finns med hela vägen från första raden till den sista.
- Lägg till ett filter och sortera A-Ö i kolumnen för kromosom
- Gå längst ner till listan och ta bort blankraderna som endast innehåller det tecken du angivit
Släktskap
Används för att ange hur en DNA-kusin är släkt. Jag använder principen ”Den personen vars DNA det är träff med (eftersom jag administrerar mina föräldrars och morföräldrars DNA) + Relationen bakåt (M för Mor och F för Far) + hur många steg ner som DNA-kusinen är ättling + Geografiskt område. Min DNA-kusin Kjell får således taggen AH_MFM_03_Värmland. Det ger mig snabbt en orientering när jag jobbar med uppgifterna. Samma kod lägger jag in på identifierade DNA-kusiner i mitt släktforskningsprogram.
Analyskommentar
Ibland har jag en teori för släktskap som ännu inte är bekräftad. Sådan information brukar jag skriva in för att jobba vidare med.
Kluster
My Heritage kan generera en klusterrapport för hundra personer. Gör det och skapa under tiden en kolumn i din flik ”DNA-matcher”. När rapporten är sparad till Excel och informationen snyggt i egna kolumner kan du använda formeln leta rad (vlookup) för att läsa in ditt klusternummer på DNA-matchningslistan. På så sätt får du ytterligare hjälp att knäcka härkomsten av dina kluster.
Tips! Kör klusterraporten då och då och spara alltid filen. Det kan skilja sig från gång till gång vilka hundra personer som kommer med i klusteranalysen. Här är gammal information också värdefull och man kan gå tillbaka och upptäcka nya saker för varje fil.
Arbeta med analys och teorier
Nu när du har en fil med all din DNA-data från alla leverantörer har du ett superverktyg i dina händer! För att länka samman informationen mellan flikarna gör jag en sista åtgärd innan jag djupdyker i resultatet:
- Gå till fliken ”Kromosomdata”. Skapa en kolumn som heter ”Släktskap”. Läs in informationen från fliken ”DNA-match” så ser du det på respektive DNA-segment.
- Stanna i fliken ”Kromosomdata”. Skapa en kolumn som heter ”Kluster”. Läs in informationen från kolumnen ”Kluster”.
För att göra egna klusteranalyser kan du då in i intressanta DNA-matchningar som du vill granska närmre och markera alla personer som har någon gemensam beröringspunkt i DNA där det börjar och slutar. På så sätt får man ett rätt brett spann. Jag har på detta sätt lyckats bena ut släktskapet med flera DNA-kusiner. Jag hade troligtvis inte ens upptäckt dom bara genom att titta i företagens egna matchlistor.
Vill du få notiser om att bloggen är uppdaterad? Följ @genealogygrowth på Instagram.
Pingback: DNA Painter – Caroline Fransson
Pingback: Pusselbitar i ett värmländskt pussel – Caroline Fransson
Pingback: Prokrastinering och struktur i symbios – Caroline Fransson
Pingback: DNA-resultatet från Ancestry klart! – Caroline Fransson
Pingback: All in på DNA Painter - Caroline Fransson