Thanks again. Спасибо большое. ------------------------------------------------------------------------------------------------------------------------------------Tenzij je het jezelf extra moeilijk wil maken, zie ik geen voldoende reden om absoluut bestandsnamen (foto bestandsnamen) in het Cyrillisch te schrijven. (ik heb het gedaan om enerzijds je te helpen en anderzijds voor de uitdaging [mensen die niet streamen moeten op een andere manier hun tijd verdoen]). Ik waardeer ten zeerste jouw kennis en hulp hierover. Ik heb familie die woont in Oekraïne en Rusland. De foto met de cyrillische bestandsnaam betekend waarschijnlijk niets voor jou. Dat is begrijpelijk. Toen ik op bezoek was bij mijn familie in Oekraïne in 2009, heb ik de twee dvd's gekocht waarop de bekendste film van Oekraïne en Rusland staat. De film noemt :ИРОНИЯ СУДЬБЫ ИЛИ С ЛЁГКИМ ПАРОМ" en iedere jaarwisseling wordt deze film in Rusland en Oekraïne vertoond tijdens de Kerst- en Nieuwjaarstijd op de tv. Je kunt het vergelijken zoals bij ons de film Alone Home. <HTML><META HTTP-EQUIV="content-type" CONTENT="text/html;charset=utf-8"> <P>Home Alone is nog steeds een populaire kerstfilm. Dat blijkt uit het feit dat de film nog elk jaar met <A title="Kerstmis" href="https://nl.wikipedia.org/wiki/Kerstmis">Kerstmis</A> op de televisie komt. In <A title="België" href="https://nl.wikipedia.org/wiki/Belgi%C3%AB">België</A> werd hij zelfs tot beste kerstfilm verkozen in <A title="2008" href="/wiki/2008">2008</A>. </P> <UL> <LI>Tagline - A Family Comedy without the Family.</LI> <LI>Tagline - Yesterday he was just a kid, tonight he's a home security system.</LI></UL> <P>Wereldwijd bracht de film 477 miljoen <A title="Amerikaanse dollar" href="/wiki/Amerikaanse_dollar">dollar</A> op. </P> Op het internet wat de tekst hierboven gewoon geschreven zonder syntaxen. Vraag me niet waarop de tekst in deze wijze op mijn wordpad is gekopieëerd. Dus als ik mijn familie in Rusland deze foto wil laten zien met de cyrillische bestandsnaam en ik schrijf dat deze op mijn website staat, moet dit dan natuurlijk eerst mogelijk zijn om deze afbeelding van deze bekende Russische film te kunnen üploaden. Als je dan beseft dat tegenwoordig het geen enkel probleem is om afbeeldingen en foto's van bekende Amerikaanse films te üploaden op de websites, zodat mensen die familie hebben in de Verenigde Staten van Amerika, dit kunnen tonen op hun website, is het wel wonderlijk dat dit nog niet kan voor Rusland en Oekraïne. Enfin toch als je bent geabonneerd bij Telenet. Hou er echter rekening mee dat de meta vermelding hoogstwaarschijnlijk bepaald welke codering je browser gaat gebruiken om de pagina te tonen. Voilà. Nu vraag ik me af wie bepaalt welke norm van codering op uw webpagina in de Header wordt aangebracht? Wie beslist daarover? Windows 10 of FileZilla? En als het algemeen bekend is dat de meeste huidige ftp programma's utf-8 ondersteunen, en dat Windows 10 dat ook doet, dan is het toch meer dan logisch dat de Telenet server zich ook aanpast aan de algemene trend op dit gebied. Of niet? FilaZilla vermeld tijdens de verbinding met de Telenet server dat de server geen niet - ascii ondersteunt. Dat is toch glashelder en uit de tijd. Ik vraag me af of de zakenmensen in de Westerse landen, die contacten hebben in Rusland en Oekraïne en die een foto van een bedrijf in Rusland of Oekraïne willen zien, om een beter inzicht te krijgen van deze Russische -of Oekraïense firma, niet in staat zijn om ook een foto van hun Belgisch bedrijf te laten zien op hun business website of webshop? Juist omdat de Telenet server utf-8 die alle wereldtalen ondersteunt niet op hun server is geladen? Raar! Op een pagina kan je dus onmogelijk een deel in codering A en een ander deel in codering B. De hexadecimale tekst van ИРОНИЯ СУДЬБЫ ИЛИ С ЛЕГКИМ ПАРОМ vind je hieronder: De Windows 1252 tekens die dezefde hexadecimale waarde hebben zijn: ИРОÐИЯ СУДЬБЫ ИЛИ С ЛЕГКИМ ПÐРОМ Dat is heel verstandig geredeneerd. Dat had ik zelf niet gevonden. Het is wel bedenkelijk als je weet dat de characters die utf-8 backwards ondersteunt tot de 127 limit (single byte 7 bits +0), minstens 2 bytes nodig hebben daarboven en toch kunnen worden geconverteerd met Windows -1252 tekens die maar één byte(8 bits) gebruiken. Want Windows -1252 ondersteunt geen 2 bytes per character of heb ik het mis? Ook verwijs je steeds naar hexadecimale voorbeelden en geen decimale of unicode points. Waarom? Op het internet kun je converteren naar hex, dec, unic en nog andere coderingstekns die worden gebruikt. Je hebt toch de Windows -1252 tekens gevonden door op het internet een converter tool te gebruiken, die converteert van de cyrillische bestandsnaam naar hex waarden die daar mee overeen komen? En waarom geen decimale overeenkomstige tekens? (in dit stukje zijn enkele tekens verdwenen omdat ze geen grafie hebben in Windows 1252. Dit toont Notepad++: Elk Cyrillisch teken in UTF-8 is steeds 2 bytes lang. Hoe heb ik omgezet? Notepad++ geopend, karakterset UTF-8 zonder Dit toont Notepad++: Elk Cyrillisch teken in UTF-8 is steeds 2 bytes lang. Hoe heb ik omgezet? Notepad++ geopend, karakterset UTF-8 zonder bom gekozen. Uw tekst gekopieerd en geplakt in Notepad++. In Notepad++ nu het karakterset Windows 1252 gekozen. Notepad ++ wil absoluut eerst opslaan, dus opslaan bevestigd en toont me dan de tekst die je hierboven ziet. Die tekst gekopieerd en geplakt in dit bericht (waar de opmering staat dat er sommige tekens verdwenen zijn). Daarna een afbeelding (altijd dezefde afbeelding met een andere naam) hernoemd door copy paste van de tekst naar de naam van de afbeelding. FileZila geopend en afbeelding in MijnZandbakje gezet. Eerst tot hier: waar de opmerking staat dat er sommige tekens verdwenen zijn. Dat op zich is niet goed te noemen, zeker niet in codering weergave tekens! Van notepad ++ naar mijn computer in de e-mailbox waar voorzeker niet dezelfde codering wordt toegepast als in notepad++. Daarna een afbeelding (altijd dezefde afbeelding met een andere naam). Die steeds dezelfde afbeelding is dat een andere afbeelding dan mijn abeelding met de cyrillische bestandsnaam? Dat is opzich al riskant, want je kent niet honderd percent de inhoud van mijn afbeelding en waarschijnlijk ook niet van jouw gekozen afbeelding. Je schrijft wel dat de inhoud van de afbeelding of foto van geen belang is en ook geen rol speelt bij een overdracht in een andere codering, maar daar ben ik niet zeker van. FileZila geopend en afbeelding in MijnZandbakje gezet. Bekijk ik MijnZandbakje met UTF-8 codering (Charset extensie) dan zie ik jouw Cyrillische tekst. Is het zo dat Charset extensie alleen voor Apple Mac os is bestemd en niet voor Windows 10? Mag ik weten voor we verder gaan op welke overdrachtmodus jouw FileZilla staat ingesteld? Automatisch dus standaard, ascii en binary? En ook bij de geavanceerde opties: Standaard-Overdrachtsinstellingen: Standaard-actief-passief en bij Tekenset: Auto-detectie- utf-8 of geforceerde utf -8- Aangepaste tekenset. Welke van de drie opties heb jij ingesteld? Dit is wel belangrijk als men dezelfde resultaten beoogd. De webpagina waar MijnZandbakje op is geüpload heeft dus in de Header een Meta met utf-8 . De server die de afbeelding van jouw laptop of pc heeft doorgstuurd is de Telenet server. Als dit alles juist is wat ik hier neerschrijf dan heeft de Telenet server samen gewerkt met de Windows 10 browser, die de hex waarden heeft herleid naar utf-8 waarden en heeft de Telenet server een tandje bijgestoken voor u( misschien omdat je netweter bent)grapje. Want normaliter verschijnt er wanneer je ook een webpagina wil opladen met FileZilla een melding bij de verbinding :de server ondersteunt geen niet-ascii bestanden. Hier is een tegenspraak omdat jouw afbeelding met de codering van een cyrillische beastandsnaam omgezet in hex waarden wel doorstuurt. Of het moet zijn dat de hex waarden niet meer de waarden hebben van een utf-8 codering maar van een ascii codering. Maar dan moet Windows 10 in jouw browser deze ascii hex waarden(tekens) weer converteren naar utf-8 waarden of coderingstekens, opdat de afbeelding op jouw webpagina kan verschijnen. (Natuurlijk als de Meta in de HEADER van jouw webpagina als charset utf-8 heeft staan. Vermits igvfer schreef dat zijn website wordt gehost door een andere provider dan Telenet, en het totaal geen problemen schept voor hem om een afbeelding of foto met cyrillische bestandsnaam te üploaden, zit hij op een ander terrein als wij en gaan zijn vergelijkingen niet op voor mijn situatie. FileZila geopend en afbeelding in MijnZandbakje gezet. Bekijk ik MijnZandbakje met UTF-8 codering (Charset extensie) dan zie ik jouw Cyrillische tekst. Hier kan ik niet volgen! Bekijk ik in MijnZandbakje met utf-8 (Charset extensie) dan zie ik jouw Cyrillische tekst. Charset extensie werkt met Apple Mac OS en heeft ook een cyrillic coderingtabel. Windows -1252 heeft geen aparte cyrillic coderingtabel.(info Charset extensie Apple Mac OS op het internet) Je merkt dat de verschillende tools niet volledig dezelfde mogelijkheden bezitten om te kunnen converteren. Deze uitleg heb ik al eerder gegeven. Van mijn part mag je gerust op andere manieren experimenteren, maar je mag nooit vergeten dat de bestandsnamen in Windows 10 altijd in UTF-8 gecodeerd zijn. Dit is heel juist en ik weet dat ook. Maar alleen dit feit en dat de Telenet server niet kan samenwerken op de normale manier zoals andere servers wel doen met utf-8, schept hier een probleem. Want FileZilla en de browser van Windows 10 voldoen aan de eisen om uw webpagina's te kunnen converteren met utf-8. En zolang het West-europese en Amerikaanse teksten en foto's of afbeeldingen zijn gaat alles goed. Het is mijn schuld niet dat de Telenet server niet de mogelijkheid heeft om cyrillische teksten die utf-8 codering nodig hebben, te converteren met utf-8 .(Opletten geblazen want alleen voor foto's en afbeeldingen met een cyrillische bestandsnaam). De cyrillische teksten vormen geen probleem. maar je mag nooit vergeten dat de bestandsnamen in Windows 10 altijd in UTF-8 gecodeerd zijn. Je kan een bestandsnaam onmogelijk in een andere codering zetten. Het zou nogal wat zijn als je in cmd een dir doet of als je in verkenner de lijst van je bestanden bekijkt. Algemeen: welke codering gebruikt werd, wordt quasi nooit als attribuut of wat dan ook meegegeven. Het is gewoon een afspraak. Voilà. Dit omvat alles. Je kan een bestandsnaam onmogelijk in een andere codering zetten. Dit houd wel in voor zover ik het kan begrijpen, dat de verscheidene converter tools op het internet alleen voor computers zijn die niet werken met Windows 10. Er zijn natuurlijk nog oudere besturingssytemen maar dit alleen ter info: UCRT can be installed on older versions of Windows, but UTF-8 support will only work on Windows 10 (November 2019 update) and newer The character set most commonly used in computers today is Unicode, a global standard for character encoding. Internally, Windows applications use the UTF-16 implementation of Unicode. In UTF-16, most characters are identified by two-byte codes. Terwijl Windows 10 toch utf-8 gebruikt op de computers en laptops. Windows-1252. Windows-1252 was the first default character set in Microsoft Windows. It was the most popular character set in Windows from 1985 to 1990. Conclusie: Van zogauw in de toekomst wanneer je een verbinding maakt met FileZilla met de Telenet server, en de melding:de server ondersteunt geen niet-ascii tekens, dan is alles opgelost. grtz, gigi De Windows 1252 tekens die dezefde hexadecimale waarde hebben zijn: enkele tekens verdwenen omdat ze geen grafie hebben in Windows 1252. Dit toont Notepad++: ИРОНИЯ СУДЬБЫ ИЛИ С ЛЕГКИМ ПАРОМ Ð˜Ð ÐžÐИЯ СУДЬБЫ ИЛИ С ЛЕГКИРœ ПÐРОМ Ð 208 Ð Latin capital letter Ethtryit.asp?deci=208&ent=ETH Ð is een character in de table Windows-1252 De code van Windows - 1252 bestaat hoofdzakelijk uit de characters Ð Als je de cyrillische bestandsnaam bekijkt dan zijn dit verschillende characters. De cyrillische dec en hex tekens volgens de tabel KOI8-R zijn als volgt: 1049/0419 1056/0420 1054/041E 1053/041D 1049/0419 1071/042F 1057/0421 1059/0423 1044/0414 1068/042C 1041/0411 1067/042B 1049/0419 1051/041B 1049/0419 1057/0421 1051/041B 1045/0415 1043/0413 1050/041A 1049/0419 1052/041C 1055/041F 1040/0410 1056/0420 1054/041E 1052/041C Hier zie je de 2 bytes en de code tekens zijn ook verschillend t.o.z. van elkaar. Dus meer waarheidstrouw. ИРОÐИЯ СУДЬБЫ ИЛИ С ЛЕГКИМ ПÐРОМ 2 bytes zijn 16 bits als ik me niet vergis, maar zoals bij de dec tekens kun je niet visueel zien of het een codering met 2 bytes is. Niet dat ik betwijfel of het wel juist is. Maar het is toch altijd koffie dik kijken als je het mij vraagt. Kom je weer een andere code tabel tegen op het internet, dan zijn de dec en hex tekens niet altijd dezelfde. Привет gigi
... Meer weergeven