lunedì 2 marzo 2020

Ipotesi di Sistema Europeo di Condivisione OPEN DATA


ODSE (Open Data Sharing Environment)
Il panorama degli open data messi a disposizione dagli enti pubblici attualmente propone una serie di accessi ai dati tramite link predisposti su apposite pagine web raggiungibili dai siti istituzionali degli stessi enti fornitori o tramite cataloghi di link, suddivisi per aree tematiche, collezionati sui portali istituzionali nazionali degli open data quali www.data.gov.it per l’Italia e www.europeandataportal.eu che reindirizza a tutti i portali open data istituzionali di tutti gli stati membri della Comunità Europea.
Tale struttura basata sui link alle risorse dati, benché consenta di accedere ai dati direttamente da applicazioni costruite ad hoc, non consente un uso ed una gestione integrata degli open data. Di fatti nel caso in cui si voglia sviluppare applicazioni che fanno uso degli open data è necessario ricercare prima i corrispondenti link sugli appositi portali per poi implementarli nelle proprie applicazioni.
Per poter mettere a sistema tutti gli open data, sia nazionali che europei, in maniera integrata e automatica potrebbe essere utile declinare, in termini di gestione, integrazione e uso degli open data, l’attuale progetto europeo EUCISE2020. Il progetto EUCISE2020 è coordinato dall’Agenzia Spaziale Italiana (ASI) e si propone di creare un sistema decentrato e distribuito per lo scambio di informazioni che colleghi fra loro tutte le comunità di utilizzatori, sia civili che militari, a livello europeo intersettoriale e internazionale, comprese le agenzie UE ed ha l’obiettivo di sviluppare una rete interoperabile di scambio e condivisione d'informazioni a partire da sistemi e piattaforme operative nazionali ed europee vigenti, in un intento di maggiore efficienza, qualità, reattività e supporto al coordinamento delle operazioni di sorveglianza nel settore marittimo europeo, nonché di promozione dell'innovazione ai fini della prosperità e sicurezza dei cittadini dell'UE.
EUCISE2020, già concluso con successo, ha dato vita ad una ambiente di condivisione di informazioni indipendente e non vincolante per i sistemi di informazione appartenenti agli enti pubblici partecipanti o per i sistemi settoriali europei già esistenti. Tale filosofia ben si presta a quelli che sono i principi cardini della condivisione degli open data.
L'ambiente EUCISE2020 è pensato per consentire l'interoperabilità dei sistemi legacy nazionali o europei appartenenti agli enti pubblici degli Stati membri mediante tre componenti:

  • uno o più Adaptor che consentono ad un sistema legacy (LS) di un ente di connettersi a un nodo nazionale. Trasforma i dati LS nel modello di dati EUCISE comune. Consente sia di fornire e sia di ricevere dati; 
  •  i Gateway (GW) – nodo nazionale semplice - che implementa le specifiche EUCISE comuni e implementa il protocollo di messaggistica per lo scambio di informazioni con gli adaptor o con gli altri gateway;
  • i Node (NODE) - gateway avanzato – che è in grado di eseguire attività e servizi avanzati come fusione e archiviazione di informazioni.

Lo scambio di informazioni tra i partecipanti in EUCISE2020 viene effettuato sulla base di un modello che prevede le seguenti funzioni:
Pull: il consumatore conosce l'elenco esatto dei fornitori e chiede informazioni; 
Pull Unknown Recipients: il consumatore non conosce l'elenco esatto dei provider e chiede le informazioni di interesse a tutti i possibili fornitori partecipanti alla rete EUCISE2020. In questo caso, potrebbero verificarsi diverse risposte alla richiesta.
Push: il provider conosce l'elenco esatto dei consumatori ed invia loro le informazioni indipendentemente dal fatto che questi abbiano precedentemente richiesto tali informazioni.
Push Unknown Recipients: il provider non conosce l’elenco dei consumatori, e quindi invia le informazioni al nodo che si preoccupa di inviarle ad un elenco di consumatori scelti secondo le regole EUCISE2020 definite in base alla comunità di appartenenza, alle aree di interesse, allo scopo, al tipo di entità ed alla sottoscrizione dei servizi disponibili.
Pubblica: il provider condivide un elenco di informazioni fornite al sistema in modalità periodica ad un elenco di consumatori che hanno sottoscritto il servizio.
Sottoscrizione: il consumatore può sottoscriversi a un servizio per ricevere automaticamente informazioni su un'entità, un’area o una comunità
Mutuando il sistema EUCISE2020 sulle esigenze di condivisione degli open data potremmo pensare ad un sistema analogo, denominato ODSE (Open Data Sharing Environment), che consenta di veicolare gli open data di tutti gli enti pubblici di tutti gli Stati membri attraverso una infrastruttura distribuita a cui tutti i sistemi open data siano collegati in modo paritario.
Ogni Stato membro predispone uno o più nodi (semplice o avanzato) a cui ogni ente pubblico può collegare un adaptor per la condivisione degli open data (sia come provider che come consumer).
Gli open data sono classificati per aree di interesse, per scopo e per tipo di entità e sono disponibili in cataloghi.








mercoledì 26 febbraio 2020

Cloud PA - Ipotesi di sistema nervoso digitale della PA

Nell'ambito di una pervasiva ristrutturazione di quello che è l'attuale panorama dei sistemi informativi della PA, in termini di data center, piattaforme informatiche e dati, una ipotesi di normalizzazione delle risorse e di ristrutturazione radicale dei sistemi informativi con una azione nazionale che coinvolga tutti gli enti della PA centrale prima e della PA locale successivamente, dovrebbe prevedere la disamina dei seguenti aspetti:
  • logistica e realizzazione dei siti (attuali data center, edifici militari di recupero, nuovi edifici, approvvigionamento energetico, zone geografiche, condizionamento climatico naturale)
  • organizzazione e gestione (governo e controllo, personale, sicurezza e protezione, outsourcing, politiche di gestione, protocolli, consulenza per le PA locali e centrali)
  • architettura fisica (architettura server farm, network farm, storage, connettività e banda ultralarga, vpn, infranet)
  • architettura logica (architettura della piattaforma software, container, virtualization, software design pattern, iam, cyber security, microservice e webservice, standard di interoperabilità)
  • approvvigionamento tecnologico (infrastruttura hardware, infrastruttura software, manutenzione e training sulle tecnologie acquisite)
  • piano di migrazione di servizi esistenti da infrastrutture obsolete e/o precarie verso paradigmi moderni messi a disposizione delle tecnologie cloud
  • piano di migrazione delle piattaforme già esistenti di interesse nazionale (SPID, ANPR, PAGOPA, ecc...)
Logistica, individuazione e realizzazione dei siti

Gli attuali data center appartenenti al gruppo A, candidati ad essere Poli Strategici Nazionali, così come individuati da AGID, entrano a far parte della costellazione dei nuovi data center realizzati in seno al nuovo "sistema informativo nazionale della PA" (potremmo chiamarlo SINPA). Tali data center potrebbero essere via via dismessi se nel tempo venga ritenuto più vantaggioso migrarne i servizi sui nuovi datacenter, o in alternativa se ne potrebbe valutare il potenziamento per offire maggiori servizi condivisi.

I nuovi datacenter potrebbero essere localizzati presso ex strutture militari cadute in disuso e restaurate opportunamente per ospitare le risose hardware, software e umane necessarie alla implementazione e gestione di un data center. Potrebbero essere recuperate, altresì, opere di edilizia incompiuta ormai abbandonate, cattedrali nel deserto realizzate principalmente in cemento armato.
In alternativa potrebbero essere realizzati ex novo individuando zone geografiche a bassa probabilità di terremoto, con caratteristiche naturali tali da agevolare il condizionamento climatico e l'approvvigionamento energetico nelle more delle buone pratiche che riguardano le realizzazioni eco-sostenibili.

Organizzazione e gestione

La gestione e il controllo centrale dovrebbe essere assicurato da personale qualificato dello Stato in organico o facente capo alla funzione pubblica coadiuvato da personale del Ministero dell'innovazione tecnologica e della digitalizzazione, da personale dell'AGID e da personale del Cert-PA ed eventualmente personale Copasir.
La sicurezza dei siti dovrebbe essere delegata alle forze armate o ai corpi di polizia.
L'assistenza specialistica e i servizi di consulenza informatica possono essere affidate a società private disponibili sul mercato opportunamente coordinate da gruppi di personale interno. Il personale interno può essere integrato di volta in volta, con la formula del comando, dal personale degli enti che detengono applicazioni e servizi all'interno dei data center nazionali.

Architettura fisica

Ogni datacenter, sia esso nuovo che preesistente, costituisce un nodo del sistema nervoso digitale della PA. Ogni nodo è collegato ad un altro attraverso una rete di connettività a banda ultralarga terrestre e di una rete di connettività satellitare alternativa (di backup). Per la connettività, CONSIP potrebbe prevedere un accordo quadro stile SPC 2 con aggiudicazione multifornitore. Ogni ente che ha servizi nei data center nazionali (per comodità potremmo chiamare Cloud PA l'insieme di tutti nodi data center) implementa una VPN con quest'ultimi in modo da vedere le proprie risorse presenti in cloud come risorse della propria rete locale. La VPN può essere usata per avere in prima istanza una struttura ibrida (servizi presso la sede dell'ente e servizi nel cloud). Questa ipotesi consentirebbe una graduale migrazione dei servizi e delle applicazioni da on premise al Cloud PA, soprattutto nei casi in cui l'ente abbia data center obsoleti su cui risulta non più vantaggioso investire. Ogni nodo dovrebbe avere un'area di disaster recovery relativa ad un solo nodo diverso da se stesso appartenente al sistema nervoso digitale della PA.
L'infrastruttura hardware (server, storage e rete) dovrebbe essere altamente scalabile e non legata ad un particolare brand.
Tutti i nodi sono forniti di comunicazione VOIP e videoconferenza gestita da un'unica infrastruttura distribuita sui nodi.    

Architettura logica
  
L'architettura logica deve essere tale da poter rendere disponibili le risorse attraverso un modello multi-tenant dove più enti condividono la stessa risorsa fisica e virtuale, assegnata dinamicamente secondo le reali esigenze. Le risorse devono essere fornite in modo flessibile permettendo una veloce scalabilità verso l'alto. Deve permettere di rendere disponibili come servizio le risorse informatiche attraverso i seguenti modelli di servizio: IaaS (Infrastructure-as-a-Service), PaaS (Product-as-a-Service), SaaS (Software-as-a-Service) e NaaS (Network-as-a-Service). L'infrastruttura cloud potrebbe essere open source o acquisita da brand noti. Nel primo caso un esempio è costituito da OpenStack, nel secondo caso esempi potrebbero essere AzureStack, RedhatStack o altre soluzioni architetturali.  

Approvvigionamento

Tralasciando per un attimo tutta la parte di procedure di appalto per la ristrutturazione o edificazione di ambienti atti ad ospitare i data center nazionali (opere edilizie, impiantistiche di fornitura energia e climatizzazione), l'approvvigionamento riguarda l'infrastruttura hardware (strato fisico) l'infrastruttura software (strato logico) e i serivizi professionali di gestione, implementazione e conduzione delle infrastrutture. 
Definita l'architettura software, l'approvvigionamento della struttura hardware, dimensionata secondo le esigenze degli enti coinvolti e della piattaforma software adottata, dovrebbe essere il risultato di un'aggiudicazione di una gara suddivisa in lotti. Un lotto per la parte server, un lotto per la parte storage, un lotto per la parte rete e sicurezza. Altri servizi come VOIP e videoconferenza possono essere acquisiti con gli usuali strumenti CONSIP del MEPA così come già fanno gli attuali enti della PA.
L'approvvigionamento dello strato software può avvenire aggiudicando uno o più appalti per la fonitura di soluzioni di virtualizzazione di risorse di calcolo, di storage e di rete al fine di implementare i quattro livelli di cloud, IaaS, PaaS, SaaS e NaaS. L'appalto potrebbe essere inizialmente affidato ad un "system integrator" che ha la libertà di scegliere tra le piattaforme più varie disponibili sul mercato, senza essere vincolato ad una unica soluzione omincomprensiva di un solo brand. Realtà italiane con la capacità di fare ciò sono ad esempio Leonardo, Telecom Italia, Aruba, ecc ...  Si potrebbe azzardare una proposta di accordo a brand consolidati, come Amazon, di fornire l'infrastruttura software dell'ambiente cloud da implementare nei data center nazionali, oltre ad eventuali servizi connessi erogati in loco. Una sorta di cloud in licenza d'uso, in controtendenza rispetto agli attuali trend che vedono tutto spostarsi dalla licenza d'uso all'abbonamento per un servizio.
Una ulteriore gara potrebbe riguardare i servizi di consulenza e le figure professionali necessari per la conduzione dell'infrastruttua fisica.

     

 

lunedì 17 febbraio 2020

Diritti digitali, sistema nervoso digitale della PA e archittettura logica dei sistemi informativi della PA

L'obiettivo del d.lgs 217 del 2017 (G.U. del 12/01/2018), disposizioni integrative e correttive al d.lgs 179 del 2016 in materia di riorganizzazione delle amministrazioni pubbliche, è quello di contribuire alla definizione di un quadro normativo idoneo ad abilitare e supportare le azioni di attuazione dell'agenda digitale dotando i cittadini, le imprese e le amministrazioni di strumenti e servizi idonei a rendere effettivi i diritti di cittadinanza digitale.
Il CAD stabilisce che le pubbliche amministrazioni si debbano organizzare utilizzando le tecnologie dell'informazione e della comunicazione per la realizzazione degli obiettivi di:
  • efficienza
  • efficacia
  • economicità
  • imparzialità
  • trasparenza
  • semplificazione
  • partecipazione
 nel rispetto dei principi di uguaglianza e di non discriminazione per l'effettivo riconoscimento dei diritti digitali dei cittadini e delle imprese.
Uno degli obiettivi più complesso da raggiungere è la trasparenza e l'open government. Mettere a disposizione l'enorme patrimonio informativo della pubblica amministrazione può diventare il volano, oltre che della trasparenza, ma anche della partecipazione.
Benché la dematerializzazione, l'archiviazione sostitutiva, la gestione elettronica dei documenti, la firma digitale, la PEC, SPID, PagoPA e la marca da bollo telematica siano mezzi indispensabili per l'attuazione delle procedure amministrative informatizzate che tendono a rendere più efficienti ed economici gli attuali processi della PA,  è solo attraverso la reingegnerizzazione dei processi che si raggiunge il vero obiettivo di efficacia.
Alla base della dematerializzazione c'è il processo di digitalizzazione dei documenti carteacei pregressi e la produzione di documenti "nativi" digitali attraverso procedure completamente informatizzate riviste rispetto alle procedure classiche preesistenti. Fondamentale per questo passaggio è l'archivio digitale le cui caratteristiche principali riguardano:
  1. il titolario di classificazione, il massimario di scarto e l'individuazione dei metadati (profilo dei documenti che descrivono i documenti e aggregati logicamente superiori nelle due coordinate di tempo e di spazio)
  2. la sostituzione dei documenti cartacei con i documenti informatici e attuazione delle politiche di scarto
  3. l'individuazione del sistema informativo e adozione delle misure di sicurezza logica e fisica del sistema
  4. l'alimentazione dell'archivio con i nuovi documenti "nativi" digitali
A fondamento della attività delle PA, oltre alle procedure, c'è l'enorme patrimonio informativo acquisito nel tempo e il corrispondente "magazzino" dei documenti prodotti e acquisiti. L'enorme "docwarehouse" della PA deve essere opportunamente mantenuto e deve poggiare su di una infrastruttura sempre disponibile, solida, scalabile e sicura. La PA per poter implementare e condurre una infrastruttura con tali caratteristiche deve sostenere un costo notevole in termini di risorse economiche, umane e logistiche. 
Inoltre una delle problematiche spesso evidenziate è che, anche volendo esternalizzare tale servizio, vi è l'incapacità di scrivere capitolati e specifiche dei requisiti che possano ben veicolare la fornitura. Questa incapacità è dovuta in parte alla mancanza di competenze specifiche negli organici delle amministrazioni e in parte al voler relegare quelle poche risorse presenti con le adeguate competenze tecniche a meri esecutori dell'ordinaria operatività tenendoli lontane dalle figure decisorie.
La naturale conseguenza è quella che vede l'amministrazione pubblica in posizione di sudditanza rispetto al fornitore dei servizi informatici e il verificarsi di situazioni di lock-in rispetto al fornitore stesso.
Per poter evitare il verificarsi di tali situazioni sarebbe opportuno che la PA si dotasse di Data Center di Stato dislocati sul territorio italiano, come già prefigurato dal Ministero per l'Innovazione Tecnologica, suddivisi per zone geografiche (ad es. un data center per il nord, uno per il centro, uno per il sud e due per le isole) che offrono un unico paradigma di piattaforma cloud a cui tutti gli enti possano far riferimento per l'implementazione ed erogazione dei propri servizi online. Ogni ente pagherebbe, oltre allo sviluppo e manutenzione dei propri servizi, una percentuale dei costi di conduzione proporzionale alla dimensione dei servizi stessi ospitati sul cloud della PA. Questo abbatterebbe drasticamente i costi che ogni amministrazione deve sostenere per i servizi di base di gestione di un CED (energia, condizionamento, logistica, asset hardware e software, aggiornamento tecnologico e manutenzione, sicurezza fisica e logica, adeguamento alle certificazioni di qualità, risorse qualificate per la conduzione dei sistemi, ecc…). Questa condivisione di risorse di base faciliterebbe anche la buona pratica del riuso che spesso è ostacolata da voler far funzionare piattaforme software in contesti hardware e software diversi da quelli in cui originariamente sono abituate a funzionare. Un unico investimento iniziale verrebbe messo a fattor comune per tutte le amministrazioni che potranno dedicarsi esclusivamente alla definizione dei servizi che intendono erogare, raggiungendo così l'obiettivo di economicità. 
La costellazione dei data center della PA, insieme alla diffusione pervasiva della connettività, nonché alla diffusione della banda ultralarga costituirebbero il sistema nervoso digitale della PA italiana. Sviluppare un tale sistema di infrastrutture digitali può garantire al nostro Paese l’autonomia tecnologica necessaria per il controllo dei nostri dati.
Dal punto di vista dell'architettura logica il modello da adottare dovrebbe essere quello dei microservizi, servizi autonomi che interagiscono tra di loro, dove ognuno è specializzato in un sol compito. Un unico compito fatto bene con il suo piccolo insieme di responsabilità. 
Nell'ambito di una richiesta di un macroservizio da parte del client, per fare da router verso i microservizi necessari è stata introdotta l'API Gateway. Essa espone una interfaccia verso il client e si preoccupa di realizzare la logica in maniera trasparente.
Quando un client chiama un unico macroservizio è l'API Gateway che lo realizza chiamando gli n servizi necessari e si occupa di restituire l'output.
Nell'architettura a microservizi la comunicazione tra i servizi in genere è basata su chiamate HTTP tramite le API REST, passando i dati in formato JSON e spesso attraverso una coda di messaggi.
Per garantire un accoppiamento lasco, ogni servizio ha un proprio schema DB. Un servizio che ha bisogno di transazioni ACID (Atomiche, Consistenti, Isolate, Durabili o persistenti) potrebbe usare un database relazionale, mentre un servizio di social network potrebbe usare un database NOSQL.
La comunicazione tra i servizi avviene attraverso la rete al fine di garantire l'indipendenza tra i servizi ed evitare ogni forma di accoppiamento.
Ogni microservizio è visto all'esterno come una black-box. Esso espone solo una interfaccia applicativa astraendo rispetto al dettaglio di come sono realizzate le sue funzionalità, al linguaggio specifico e alla tecnologia usati. In questo modo il cambiamento di ciascun microservizio non impatta sugli altri.