- unicode utf-8 latin encoding