Gisteren was ik bij de SPSS-U-Day. Productsessies en cases op een leuke locatie (Archeon), een prachtige demonstratie van turnster Renske Endel, een schitterend verteld verhaal door olympisch kampioen Maarten van der Weijden en dit alles vakkundig aan elkaar gepraat door professor Ed Peelen.
Ik vond de kwaliteit van de presentaties echter nogal wisselend. Wel ben ik een aantal interessante zaken tegengekomen: Geodan Mapper en SPSS Statistics 17.0. Zie mijn korte verslag hieronder.
Deze pagina is alleen toegankelijk voor leden.
Login. Heeft u nog geen account? Registreer nu!
3 Reacties »
Op YouTube (en Google Video) staat een complete reeks van 13 colleges over Statistical Aspects of Data Mining gegeven door David Mease in het kader van de Google Tech Talks. Dezelfde colleges heeft hij ook op Stanford gegeven. De collegereeks heeft een eigen site met daarop de bijbehorende powerpoint slides: stats202.com
Ruim 10 uur kijkplezier dus! De eerste aflevering kan je hieronder bekijken:
2 Reacties »
Een leuk interview met Michiel van Straten van KPN Zakelijk, over de kracht van voorspellende modellen.
Het leest alsof SPSS een uit de hand gelopen hobby is geweest daar, maar zo zal ie het ongetwijfeld niet bedoeld hebben. Ze hebben er evenwel nu zo’n dertig veertig modellen gebakken, maar of ze nou allemaal in productie zijn, wordt mij niet duidelijk. Niettemin, nog altijd een respectabel aantal.
En hij breekt een lans voor de decision tree/beslisboom/answer tree/CHAID etc. Héérlijk! Vaak zijn deze modellen net zo goed als hun zogenaamde geavanceerde technieken-broertjes, maar ze hebben 1 groot voordeel: ze communiceren zo lekker naar de marketeers. Zodat zelfs al die rightbrainers het snappen!
Lees hier het interview: [klik].
4 Reacties »
Speciaal voor de manager die wel eens wil weten waar zijn/haar analisten nou de hele dag druk mee zijn, biedt SPSS de cursus “Datamining voor Managers” aan. Op 21 mei leert de manager:
“…waar de analisten binnen uw team zich mee bezighouden, wat belangrijk is voor het werk van uw analisten en waar struikelblokken liggen. Wilt u met meer vertrouwen een inhoudelijke discussie aan kunnen gaan met uw analisten? Dan mag u de training “Data mining voor managers” absoluut niet missen!”
Lijkt me best een goed initiatief. Moeten ze de manager natuurlijk niet allemaal van die fantastisch mooi geprepte trainingsbestanden geven waar altijd iets interessants uit komt, wat zo zit de echte wereld natuurlijk niet in elkaar.
Betekent wel dat je dit en dit je baas niet meer wijs kan maken
5 Reacties »
“All bad decisions are based on someone’s clueless interpretation of data“, aldus het genie achter Dilbert, Scott Adams.
Via Google Book Search (aanrader, kijk eens op database marketing boeken!), kwam ik drie meesterlijke strips tegen over datamining en database marketing, zie hier en hier (als de links niet meer werken, Google verandert ze af en toe uit copyright overwegingen, kijk dan zelf in Google Books op pagina 109 en 133!). Werkelijk pareltjes voor de werkvloer. Dus: uitprinten en ophangen naast de al even meesterlijke Dilbert over dashboards!
5 Reacties »
Beleggingspecialist op RTL Z: “Gezien de boterproductie in Bangladesh, alsmede de mondiale ontwikkelingen van de schapenpopulatie, hebben wij hoge verwachtingen van het totaalrendement voor wereldwijde aandelen“. Ik weet weinig tot niets van aandelen, toch zou ik bij het horen van deze uitspraak mijn wenkbrouwen licht fronsen.
Deze pagina is alleen toegankelijk voor leden.
Login. Heeft u nog geen account? Registreer nu!
7 Reacties »
In de VS zijn de universiteiten verwikkeld in een hevige concurrentiestrijd met elkaar en met buitenlandse opleidingen. Voeg daarbij het gegeven dat er door de veranderende demografie straks minder studenten zullen zijn en je zult begrijpen dat ze er hard aan moeten trekken. Dus grijpen ze nu naar de CRM tools en predictive analytics, aldus het artikel Educational institutions turn to CRM, predictive analytics op DM News. Hiermee proberen ze ook te voorspellen welke studenten het waarschijnlijk niet gaan redden en dus hulp nodig hebben.
Wat dat laatste betreft zijn er overeenkomsten met het peperdure systeem ($80 mln!) dat op scholen in New York wordt geimplementeerd, waarover ik eerder heb bericht.
1 Reactie »
De Amerikaanse overheid heeft sinds de 9/11 aanslagen 14 data mining programma’s lopen, waarvan er tien zeer waarschijnlijk persoonlijke informatie gebruiken, zoals belgedrag en financiele transacties.
Nutteloos en een schadelijke verspilling van (belasting)geld en tijd stellen Jeff Jonas en Jim Harper in het interessante artikel Effective Counterterrorism and the Limited Role of Predictive Data Mining, waarbij ook nog eens onnodig inbreuk wordt gemaakt op de privacy.
Redenen:
- Door het relatief kleine aantal aanlagen of pogingen daartoe is er te weinig historische data om patronen in planning en voorbereiding van een aanlag te ondekken. Citaat: “The one thing predictable about predictive data mining for terrorism is that it would be consistently wrong”
- Zelfs een uitstekend model zal nog teveel vals positieve resultaten opleveren. Bij Direct Marketing is dit niet erg (een goed model levert een winst op in de kosten/baten verhouding), bij terrorismebestrijding zal het er op neer komen dat je miljoenen mensen onder de loep moet nemen die ten onrechte zijn gekenmerkt als potentieel terrorist.
Daarbij maken de auteurs pijnlijk duidelijk dat met ambachtelijk speurwerk, wat meer inzet, betere samenwerking en het delen en gemakkelijker toegankelijk maken van bepaalde informatie de aanslagen wellicht wel waren te voorkomen: Van twee kapers wisten ze dat ze in het land waren, dat ze banden hadden met al-Qaeda en dat ze mogelijk betrokken waren bij de aanslagen op ambassades en de USS Cole. Veel moeite om zich te verstoppen, deden ze niet: ze gebruikten hun eigen naam om rijbewijzen aan te vragen en rekeningen te openen. De plegers stonden geregeld met elkaar in contact.
Zie ook het artikel Data mining: The new weapon in the war on terrorism? dat ik eerder aanstipte op deze blog.
Bronnen:
CATO: Effective Counterterrorism and the Limited Role of Predictive Data Mining
FCW.com: Data mining: The new weapon in the war on terrorism?
Geen reacties, reageer! »
Twee leuke initiatieven voor datanerds: Swivel en Data360. Het zijn beiden sites waar je datasets kunt uploaden, visualiseren, becommentarieren, delen met anderen en crossen met andere data. De oprichters van Swivel typeren hun site toepasselijk als de “Youtube voor data”.
Datasets kunnen met elkaar worden vergeleken om mogelijke correlaties te ontdekken. Swivel vergelijkt zelfs automatisch jouw dataset met de andere datasets om vervolgens crossings voor te stellen.
Swivel en Data360 lijken elkaar weinig te ontlopen, al ziet Swivel er wat toegankelijker uit. Heb ze nog niet geprobeerd, maar ga dat zeker in de toekomst doen!

Leuke slogan van Swivel: “Swivel is a place where curious people explore all kinds of data.”
Datavisualisatiegoeroe (leuk scrabblewoord) Stephen Few heeft overigens wel wat commentaar op de presentatie van de data op beide sites (zie hier en hier), maar dat mag de pret niet drukken.
Linktips:
Geen reacties, reageer! »
“Crime Idol” list, zo noemt Privacy International het initiatief van de Engelse politie om met behulp van daderprofielen een lijst samen te stellen van de honderd meest gevaarlijke potentiele verkrachters en moordenaars. Je leest het goed: het gaat hier om personen die deze misdaden nog niet hebben begaan, maar die waarschijnlijk zullen begaan. Aldus een artikel in The Times. Hoe waarschijnlijk wordt er niet bij gezegd.
Het model dat patronen in crimineel gedrag moet voorspellen, gebruikt hiervoor als input verklaringen van ex-partners, psychiatrisch/maatschappelijk werker en eerdere aanklachten. De politie en andere instanties willen deze gegevens gebruiken om verdachten te identificeren voordat ze vervallen tot ernstige(re) misdaden. Vooral plegers van huiselijk geweld worden op de korrel genomen omdat hier het risico op nog ernstigere misdrijven hoger is. Acties die dan ondernomen kunnen worden, zijn het voorbereiden van arrestaties of het alarmeren van maatschappelijke instanties.
Het zal geen verassing zijn dat de privacy instanties niet laaiend enthousiast reageren. Het risico dat onschuldigen in het bestand komen is niet geheel denkbeeldig en het artikel trekt een parallel met de film/boek Minority Report.
Bron:
The Times: Police target dangerous suspects before they can offend
Geen reacties, reageer! »