Instruktionsdataset på Svenska

Data Set by Tim Isbister 121d ago update
Tools & Methods
Datasetet består av ca 100 000 exempel där det är en dialog mellan en användare och en assistant. 

Assistantens uppgift är att svara på instruktionerna. Detta dataset kan användas för att finetunea språkmodeller till att följa instruktioner, såsom te.x ChatGPT.

Exempel data:

[
  {
     "from":"human",
     "value":"Vilket naturfenomen, som orsakas av att ljus reflekteras och bryts genom vattendroppar, resulterar i en färgglad båge på himlen?",
     "weight":null
  },
  {
     "from":"gpt",
     "value":"En regnbåge är ett naturligt fenomen som uppstår när ljus reflekteras och bryts genom vattendroppar i jordens atmosfär. Denna spridning av ljus resulterar i en färgglad båge på himlen, vanligtvis med färgerna rött, orange, gult, grönt, blått, indigo och violett. Regnbågar dyker oftast upp efter regnfall och under soliga intervaller.",
     "weight":null
  }
]
 

This is a machine translated instruct dataset from OpenHermes-2.5. The facebook/seamless-m4t-v2-large was used, and some post filtering is done to remove repetitive texts that occurred due to translation errors.

Attributes

Data
Information Technology
Research & Development, IT & Software
Tools & Methods
Creation, Language
DNN, Foundation Model, Machine Learning, NLP, Transformer
Textual Data
Service / Offering