logo cours PACECOURS I : Création de documents
HTML

WEB - Internet

Introduction : historique

World Wide Web : projet qui a débuté en 1989 au CERN et qui avait pour but de trouver un moyen de partager les idées et les recherches entre employés et chercheurs éparpillés dans le monde entier. Il a été appelé "a hypertext project".

Du point de vue technique, le WWW se réfère à la notion de "cyberspace" de l'information, c'est-à-dire à l'ensemble des théories relatives à la communication et à la régulation dans l'être vivant et la machine.

Internet se réfère à la notion physique d'un réseau c'est-à-dire les câbles et les ordinateurs.

Ce qui lie le WWW et Internet est l'utilisation de protocoles c'est-à-dire le langage et les règles par lesquelles les ordinateurs communiquent. TCP/IP (Transmission Control Protocol and Internet Protocol) est une collection de protocoles de réseaux qui permet à différents type d'ordinateurs de communiquer. Il est le protocole de prédilection d'Internet.

Le WWW connecte plusieurs protocoles entre eux 1: FTP (File Tranfer Protocol), telnet, WAIS (Wide-Area Information Servers) et d'autres encore. C'est parce que le WWW utilise le protocole Internet pour transmettre des documents et des fichiers que Web et Internet sont synonymes.

Le navigateur Mosaic Web de National Center for Supercomputing marqua le début de la popularité du Web en novembre 1992. Au début de 1993, il n'y avait que 130 sites. Aujourd'hui ?

Fonctionnement du WEB :

La publication Web fonctionne sur le principe Client-Serveur.

Client-server:

Un serveur Web est un programme qui s'exécute sur un ordinateur dédié et qui fournit des documents à des ordinateurs qui en font la demande.

Un client Web est un programme qui permet à l'utilisateur de demander des documents à un serveur Web.

HTTP : HyperText Transfer Protocol

Appelé aussi HyperText Transmission Protocol. Il fut développé comme le protocole d'échanges standards pour le Web. Ce langage est utilisé entre le client web et le serveur web (communication téléphonique structurée : Le client ouvre la connexion puis envoie une http requête et le serveur répond puis ferme la connexion). (voir HTML 3.2. HOW TO page 893)

Le serveur doit fonctionner sur un "multi-tasking operating system". Cependant il existe sur différentes plate-formes (windows, windowNT, MacIntosh, VMS, UNIX...).

La capacité d'HTTP est de manipuler une multitude de protocoles d'applications ce qui permet aux utilisateurs d'accéder à des protocoles d'Internet tels que FTP, Gopher.

HTTP permet aussi l'utilisation de multimédia : affichage de textes, graphiques, animations et écoute de sons enregistrés.

Browser = Navigateur

C'est un logiciel installé sur l'ordinateur du client, capable de lire des documents sur le WEB.

Le client se connecte à un ordinateur caractérisé par son adresse réseau appelée URL (Uniform Resource Locator). Ce client demande un document web à l'ordinateur serveur web. Le serveur répond en envoyant le texte et d'autres informations (textes, images, sons, animations) référencées par un lien (hyperlink).

Le document que le serveur envoie est un document HTML (HyperText Markup Language). Les documents HTML sont aussi appelés Documents Web.

Parmi les plus connus : NCSA Mosaic, Netscape, Internet Explorer

L'apparence d'un document peut varier d'un navigateur à l'autre en fonction des capacités du système sur lequel il est installé et des préférences choisies par l'utilisateur.

L'Hypertexte (HTML et la programmation de serveurs)

Dans les années 60, hypertexte se référait à du texte contenant des connexions à d'autres documents de sorte que le lecteur puisse clicker sur un mot ou une phrase afin d'obtenir des informations supplémentaires en relation avec le mot ou la phrase.

URL :

Le navigateur permet à l'utilisateur de spécifier une URL et d'établir la connexion avec le document ou la ressource. Si le document contient de l'hypertexte, la sélection de celui-ci est en réalité une demande d'ouverture d'une URL.

Un navigateur peut aussi être un client FTP ou Gopher ou telnet.

Un hyperlink peut aussi renvoyer à une autre ressource (ex: e-mail)

La structure d'une URL est :

http://webdoc.best.com

protocol, machine, network, domaine

exemples : voir page 10 de HTML publishing of the Internet

Sécurité :

De plus en plus, les serveurs se préoccupent de sécurité de l'information : encryptage et authentification des clients sont la base de cette sécurité. Les standards de base ont été développés par le CERN.

Le langage HTML :

A ses début, Internet était un environnement multiplateforme où l'échange de documents était difficile. On inventa le SGML (Standard Generalized Markup Language) pour résoudre les problèmes de partage de documents. Il se concentra sur le contenu de l'information du document texte et non pas sur sa forme. SGML permettait à l'utilisateur final de faire sa mise en page selon ses convenances (affichage et impression).

Le langage standard du WEB pour la création et la reconnaissance de documents hypermédia est l'HyperText Markup Language communément appelé HTML.

HTML dérive de SGML. Les documents HTML sont des fichiers ASCII contenant des codes de formatage (tags) : information sur la mise en page de styles de texte, de titres de documents, de paragraphes, de listes et de liens hypertextes.

Il y a eu 3 versions de HTML. La version 2.0 fut la plus répandue. Les navigateurs actuels se basent sur cette version mais certains ont développé des extensions qui correspondent à la version 3. (par ex: les tables, les frames, etc.).

Structure d'un document HTML :

Tags:

Les codes de formatage sont appelés "Tags" ou Balises et encadrent le texte ou l'information concernés. Ils sont à la charge de l'auteur du document. Ex:

...texte courant <balise>texte affecté par la balise</balise>suite du texte....

ex du gras : <B>.. </B>

Caractères spéciaux:

ex du signe > il faut le remplacer par &gt; (< &lt;)

Parmi les caractères spéciaux il faut tenir compte des caractères accentués :

"Le Naïf" a déjà été créé au théâtre français

Codes de structure :

(HTML, HEAD, TITLE, BODY) Voir exemple dans simpliste.htm

HTML avec HoTMetaL PRO 3.0 sur PC : exercices à l'appui

Notion de structure

balises, squelette, paragraphe (exercice 1)

Notion de lien ("go to")

Notion d'URL , notion d'ancre (entre fichiers), notion de cible (target name)