Ändringar i Web of Science ”plain text”-format

Vi som arbetar med att läsa ned filer med publikationsposter från WoS har upptäckt att det gjordes en del ändringar i formatet i samband med Thomsons uppdatering av tjänsten sommaren 2011. Bland annat har ändringarna lett till att skripten för import av ISI-data i Network Workbench har slutat fungera och att ämnesklassningen har bytt fält-tag.

För att andra ska slippa gå igenom samma detektivarbete som jag vill jag här dokumentera de ändringar jag hittills har noterat:

Första raden i plain-text-filen har ändrats från:

FN ISI Export Format

till

FN Thomson Reuters Web of Knowledge

Vill man att filen ska fungera i Network Workbench (NWB) måste man ändra tillbaks denna rad till den gamla filidentifieraren.

Suffixet framför UT-numren har ändrats från ISI: till WOS:
Även här behöver man ändra för att filen ska fungera i NWB.

Taggen för tidskriftsklassningen har ändrats från SC till WC.

Vad som är än värre är att det också har dykt upp en ny mystisk ämnesklassning som nu använder taggen SC. Det är ännu oklart vad denna ämnesklassning står för, men det är inte de reguljära tidskriftsklasserna.

Numera förekommer även dubbelklassning av dokumenttyper för publikationer som registrerats både i SCIE och ISI Proceedings, fast med olika dokumenttyper:

Article; Proceedings Paper

Om det är någon som sett några fler ändringar eller har mer info om de ändringar jag sett; kommentera gärna här.

// Uffe

Annonser
Det här inlägget postades i Bibliometriteknik. Bokmärk permalänken.

5 kommentarer till Ändringar i Web of Science ”plain text”-format

  1. Andrew Butterworth skriver:

    Tack för detta, Ulf. Jag är ny till Network Bench så jag gjorde antagandet att jag bara gjort fel vid importeringen. Nu vet jag!
    /Andrew

  2. Ulf Kronman skriver:

    Japp, det blir en del sök-och-byt om man vill på NWB att lira med det nya plain-text-formatet. Jag har rapporterat detta på NWB:s supportforum. Man kan dock inte vänta sig någon fix för detta i NWB, för teamet verkar satsa krutet på uppföljaren Sci2 (som fortfarande är alpha och för buggig för att använda).
    Som grädde på moset tycker jag mig ha noterat att Thomson nu levererar sina plan-text-filer med sk. byte-order-mark (BOM) som första tecken i filen och det är något som importrutinen i NWB inte förväntar sig. Jag brukar alltså spara om filerna utan BOM innan jag importerar i NWB. Jag gör detta med TextWrangler på Mac. Jag tror att PSPad för Windows kan göra samma ändringar av BOM.

  3. Mikael Graffner skriver:

    Ang. tidskriftsklasserna så visar tydligen SC-taggen numera istället Web of Knowledge-kategorier. Hur dessa egentligen skiljer sig från de traditionella kategorierna är dunkelt .
    Så här står det i FAQ:n för den nya versionen (http://wokinfo.com/wok5/faq/):
    Have the subject categories in Web of Science changed in this new version?

    We have added more subject categories to Web of Science in order to give you a high level view of subjects that is consistent across all Web of Knowledge. This does not change the specific Web of Science categories that were used in the previous version of Web of Knowledge (version 4). You will still see them on both the Full Record and Refine panel in the Web of Science. We have simply added the Web of Knowledge categories as well.

    Och i hjälptexten till sökgränssnittet står följande kortfattade information att läsa:
    Web of Science Category
    The traditional category assigned to a journal
    Subject Category
    The subject category of a journal such as Biochemistry & Molecular Biology, Environmental Sciences & Ecology, and Evolutionary Biology.

    /Mikael

  4. Ulf Kronman skriver:

    ”We have simply added the Web of Knowledge categories as well.”
    Om det ändå vore så enkelt hade det inte varit något problem. Nu har de ju också bytt tag för tidskriftsämnesfältet från tidigare SC till WC och sedan stoppat in de nya WoS-ämneskategorierna bakom taggen SC. Jag fick ut konstigheter i en av mina analyser och blev tvungen att gräva i detaljerna för att förstå vad som hänt. Man kan ju undra om det har blivit fel, eller om jag har missförstått något. // Uffe

  5. manblirsatrott skriver:

    Bockar & tackor!
    Per Funke Oru

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s