The seven-deadly-sins-of-bioinformatics3960

The Seven Deadly Sins of Bioinformatics Professor Carole Goble [email_address] The University of Manchester, UK The myGrid project OMII-UK

Roadmap ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Intractable Problems in Bioinformatics. Have we sinned? Are these part of the intractable problem?

The traditional sins…. ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],http://en.wikipedia.org/wiki/Seven_deadly_sins [Stevens and Lord]

Methodology ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

I am grateful to… ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

They came up with more than seven. But I beat them into submission. Many are highly inter-related. Hopefully they are all too familiar.

Sins ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],Sin 1

Reinvention ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Comparative Genomics? Tisk! Its Comparative Bioinformatics Bioinformatics is about mapping one schema to another, one format to another, one id scheme to another. What a waste of time. What a handy distraction from doing some Real Science™.

Names and Identity Crisis Q92983 O00275 O00276 O00277 O00278 O00279 O00280 O14865 O14866 P78507 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Q93038 = Tumor necrosis factor receptor superfamily member 25 precursor P78515 Q93036 Q93037 Q99722 Q99830 Q99831 Q9BY86 Q9UME0 Q9UME1 Q9UME5 Annotation history: http://www.expasy.org/uniprot/Q93038

Andy Law's Third Law ,[object Object],http://bioinformatics.roslin.ac.uk/lawslaws.html

The Selfish Scientist ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Some causes of the Identity Crisis ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Pocock]

Id Reinvention ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],urn:lsid:uniprot.org:{db}:{id} http:// purl.uniprot.org /{db }/{id}

Andy Law’s First (Format) Law ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],http://bioinformatics.roslin.ac.uk/lawslaws.html

[object Object],[object Object],[object Object]

Reinvention of Ontology tools ,[object Object],[object Object],The Montagues and The Capulets.. Let me get my bullet-proof vest …

The “Oh No” OBO Pragmatists Aesthetics Philosophers Life Scientists Capulets Knowledge Representation Montagues A means to an end Content providers Theoreticians The end Mechanism providers Spiritual guides The Montagues and The Capulets …SOFG 2004, KCap 2005, Comparative and Functional Genomics 2004 Endurants, Perdurants, Being, Substance, Event

Yet another database … ,[object Object],[object Object],[object Object],FlyBase, WormBase, SGD, BeeBase and many other large and small community databases

BioBabel ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Integration ,[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object]

Any more ? ,[object Object],[object Object],[object Object],[object Object],[object Object]

Reuse Rocks. Collaboration through workflow and web services ,[object Object],[object Object],[object Object],[object Object]

Recycling, Reuse, Repurposing ,[object Object],[object Object],[object Object]

Warning! Reuse is Hard ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Bullying and the Borg ,[object Object],[object Object],[object Object],[object Object]

Reinvention or Invention? Pre-dating ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

A few months in the laboratory (or the computer) can save a few hours in the library (or on Google). Westheimer's Law (with additions).

No tool is an island… ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

I know what it means... ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],“ AI limericks” by Henry Kautz http:// www.cs.washington.edu/homes/kautz/misc/limericks.html

Not just bioinformatics Computer Science is Guilty!

Why don’t biologists modularise OWL ontologies properly? Er, well, like how should we do it “properly” and where are the tools to help us? We don’t know and we haven’t got any. But here are some vague guidelines. W3C Semantic Web for Life Sciences mailing list, 2005

“ I don't blame them [MGED/PSI community] because to truly comprehend RDF/OWL is not an easy task, it takes not just the understand of technology itself but more so the vision on how things should and can work in SW.” “ One thing we have to remember is that biologists are building ontologies to do a job of work. They are not produced as some end of CS or SW research” “ Principles are all well and good, but we should know from decades of software engineering that saying "do it properly" isn't a solution. We need tooling and methodologies that do not in themselves hinder a domain specialist. In many cases it is easier to re-develop than re-use or even cut-and-paste from an existing ontology than it is to muck around “doing it properly”” “ There is actually a gap between the view of ontology for CS people and for biological people. The ontology in biologist's eyes are more of a treaty than logical representation, that in CS view is on the reverse of that view. It needs dialog to bring the view to a middle ground and mechanisms to stretch to both directions.”

Standards are boring (but important) ,[object Object],[object Object],[object Object],[object Object]

Self promotion ,[object Object],[object Object],[object Object],[object Object],Not all software and databases are equal.

Research – Production Confusion ,[object Object],[object Object],[object Object],[object Object]

Trust I don’t trust your code I don’t trust your data I don’t trust you will still be around in 1 year

Sin 2 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Biologist exceptionalism ,[object Object],[object Object],I’m different. We are all individuals.

Biological exceptionalism ,[object Object],[object Object],[object Object],[object Object],[object Object]

We are so much more complex… ,[object Object],[object Object],[object Object]

Other Sciences…. ,[object Object],[object Object],[object Object],[object Object]

Biology Exceptionalism ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Sin 3 ,[object Object],[object Object],[object Object],[object Object]

Autonomy is death! ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Lincoln Stein said a while ago… ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],… and he could say it again today.

Law's Second Law ,[object Object]

Workflow commodities ,[object Object],[object Object],[object Object],[object Object],[object Object]

The myGrid Semantic Sweatshop ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Semantic

The myGrid Semantic Sweatshop notice how tired they look Franck Tanoh Katy Wolstencroft

Churn, Churn, Churn ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Churn, Churn, Churn ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Sin 4 ,[object Object],[object Object],[object Object],[object Object],[object Object]

I know it all. ,[object Object],[object Object],[object Object],[object Object],[object Object],And what would you suggest, Mr. Smartie Pants?

Think like me! ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Misunderstanding and disrespecting users

A good User Experience outweighs smart features. Can I use it? Is the user interface familiar? Does it fit with my needs?

Gain-Pain pay-off ,[object Object],Gain Pain Very BAD Good, but Unlikely Just right

Sin 5 ,[object Object],[object Object],[object Object],[object Object]

More, more, more! ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[Cameron]

The trouble with warehouses ,[object Object],[object Object],[object Object],[object Object],[object Object]

More More More ,[object Object],[object Object],[object Object],[object Object]

Mash-Up Data Marshalling ,[object Object],[object Object],[object Object],[object Object],Mash Up Application User interface Protocol objects Protocol Protocol

Distributed Annotation System Mash-Up http://www.biodas.org Reference Server AC003027 AC005122 M10154 Annotation Server Annotation Server AC003027 M10154 WI1029 AFM820 AFM1126 WI443 AC005122 Annotation Server

Sin 6 ,[object Object],[object Object],[object Object],[object Object],[object Object]

Ennui ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Its black and white ,[object Object],[object Object],[object Object],[object Object],[object Object]

Quality Delusions ,[object Object],[object Object],[object Object],[object Object]

Black Box Science ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

“ No experiment is reproducible.” Wyszowski's Law “ An experiment is reproducible until another laboratory tries to repeat it.” Alexander Kohn

Sin 7 ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],www.CartoonStock.com .

Hackery ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

“ I am sure one could reuse large parts of re-annotation for building transcriptome maps, if they only used workflows and ontologies”. Marco Roos A Biologist and Bioinformatician VL-e Project, Amsterdam

“ Bioinformaticians have reached the standards of the 1980s, while computer scientists are working on the standards of the 2020s, leaving roughly 40 years to bridge. Marco Roos A Biologist and Bioinformatician VL-e Project, Amsterdam

Blind faith in XML ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],XML

Blind Faith in Foo. ,[object Object],[object Object],[object Object],[object Object]

Pioneering development methods ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Open Source Blinkers ,[object Object],[object Object],[object Object]

Sin Summary Maybe only one “original sin” in bioinformatics. Parochialism and Insularity Exceptionalism Autonomy or death! Vanity: Pride and Narcissism Monolith Meglomania Scientific method Sloth Instant Gratification Reinvention Churn

Can we become less sinful? Why do these sins exist? Are bioinformaticians particularly naughty? No naughtier than Computer Scientists. And its all very hard. Though they are naughty…

Why? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Luddism? Surely not! ,[object Object],[object Object],[object Object],[object Object],[Stevens]

Practical Steps? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

FaceBook & Bazaar for Workflow e-Scientists myexperiment.org Trials start August 2007!

Practical Steps for IT Platforms? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Practical Steps? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Web 2.0 Design Patterns ,[object Object],26/2/2007 | myExperiment | Slide ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

The Final Word Sin writes histories, goodness is silent. Thomas Fuller

The seven-deadly-sins-of-bioinformatics3960

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to The seven-deadly-sins-of-bioinformatics3960

Similar to The seven-deadly-sins-of-bioinformatics3960 (20)

Recently uploaded

Recently uploaded (20)

The seven-deadly-sins-of-bioinformatics3960

Editor's Notes