Conference Program: SIGMOD Sessions

This page describes the complete SIGMOD Conference program. Please use the following links to skip to the sessions of interest:

Research Sessions
Industrial Sessions
Tutorials
Demonstrations
Keynote Talks
Panel Sessions
Research Plenary Sessions
Awards

SIGMOD RESEARCH SESSIONS

Research Session 1: Advanced Query Processing
Session Chair: Walid Aref Purdue University
Efficiently Evaluating Complex Boolean Expressions
Marcus Fontoura, Yahoo! Research; Suhas Sadanandan, Yahoo! Inc; Jayavel Shanmugasundaram, Yahoo! Research; Sergei Vassilvitski, Yahoo! Research; Erik Vee, Yahoo! Research; Srihari Venkatesan, Yahoo! Inc; Jason Zien, Yahoo! Inc
How to ConQueR Why-Not Questions
Quoc Trung Tran, NUS; Chee-Yong Chan, National University of Singapore
Call to Order: A Hierarchical Browsing Approach to Eliciting Users' Preference
Feng Zhao, NUS; Gautam Das, University of Texas at Arlington; Kian-Lee Tan, National University of Singapore; Anthony Tung, National University of Singapore
Boosting Spatial Pruning: On Optimal Pruning of MBRs
Tobias Emrich, Ludwig-Maximilians-Universitaet Munchen; Hans-Peter Kriegel, University of Munich; Peer Kroger, Ludwig-Maximilians-Universitaet Munchen; Matthias Renz, Ludwig-Maximilians-Universitaet Munchen; Andreas Zuefle, Ludwig-Maximilians-Universitaet Munchen

Research Session 2: Data Cleaning & Data Mining
Session Chair: Timos Sellis National Technical University of Athens
Leveraging Spatio-Temporal Redundancy for RFID Data Cleansing
Haiquan Chen, Auburn University; Wei-shinn Ku, Auburn University; Haixun Wang, Microsoft Research, Asia; Min-Te Sun, National Central University, Taiwan
Sampling Dirty Data for Matching Attributes
Henning Koehler, The University of Queensland; Shazia Sadiq, The University of Queensland; Yanfeng Shu, CSIRO, Tasmanian ICT Centre; Kerry Taylor, CSIRO, ICT Centre; Xiaofang Zhou, The University of Queensland
ERACER: A Database Approach for Statistical Inference and Data Cleaning
Chris Mayfield, Purdue University; Jennifer Neville, Purdue University; Sunil Prabhakar, "Purdue University, USA"
Recsplorer: Recommendation Algorithms based on Precedence Mining
Aditya Parameswaran, Stanford University; Georgia Koutrika, Stanford University; Benjamin Bercovitz, ; Hector Garcia-Molina, Stanford

Research Session 3: Graph Data & Querying
Session Chair: Lin Qiao, IBM Alamden Research
TEDI: Efficient Shortest Path Query Answering on Graphs
Fang Wei, University of Freiburg
GBLENDER: Towards Blending Visual Query Formulation and Query Processing in Graph Databases
Changjiu Jin, Nanyang Technological Univ; Sourav S Bhowmick, Nanyang Technological Univ; Xiaokui Xiao, NTU, Singapore; James Cheng, Nanyang Technological Univ; Byron Choi, Hong Kong Baptist University
Computing Label Constraint Reachability in Graph Databases
Ruoming Jin, Kent State University; Hui Hong, Kent State University; Haixun Wang, Microsoft Research, Asia; Yang Xiang, Kent State University; Ning Ruan, Kent State University
Pregel: A System for Large-Scale Graph Processing
Greg Malewicz, Google, Inc.; Matthew Austern, Google, Inc.; Aart Bik, Google, Inc.; James Dehnert, Google, Inc.; Ilan Horn, Google, Inc.; Naty Leiser, Google, Inc.; Grzegorz Czajkowski, Google, Inc.

Research Session 4: Data Streams & Time-series Data
Session Chair: Alex Labrinidis University of Pittsburgh
PR-Join: A Non-Blocking Join Achieving Higher Early Result Rate with Statistical Guarantees
Shimin Chen, Intel Labs Pittsburgh; Phillip Gibbons, Intel Labs Pittsburgh; Suman Nath, Microsoft
PODS: A New Model and Processing Algorithms for Uncertain Data Streams
Thanh Tran, UMass Amherst; Liping Peng, UMass Amherst; Boduo Li, UMass Amherst; Yanlei Diao, University of Massachusetts; Anna Liu, UMass Amherst
Fast Approximate Correlation for Massive Time-series Data
Abdullah Mueen, UC Riverside; Suman Nath, Microsoft; Jie Liu, Microsoft Research
An Algorithmic Approach to Event Summarization
Peng Wang, Fudan University; Haixun Wang, Microsoft; Majin Liu, Fudan University; Wei Wang, Fudan University

Research Session 5: Innovative Data Management
Session Chair: Mirek Riedewald Northeastern University
Spreadsheet As a Relational Database Engine
Jerzy Tyszkiewicz, University of Warsaw
Scalable Architecture and Query Optimization for Transaction-time DBs with Evolving Schemas
Hyun Moon, NEC Labs; Carlo Curino, MIT; Carlo Zaniolo, UCLA
Data Conflict Resolution Using Trust Relationships
Wolfgang Gatterbauer, University of Washington; Dan Suciu, University of Washington
Analyzing the Energy Efficiency of a Database Server
Dimitris Tsirogiannis, University of Toronto; Stavros Harizopoulos, HP Labs; Mehul Shah, HP Labs

Research Session 6: Location & Sensor Based Data
Session Chair: Gottfried Vossen WWU Munster
Processing Proximity Relations in Road Networks
Zhengdao Xu, University of Toronto; Arno Jacobsen, University of Toronto
Searching Trajectories by Locations - An Efficiency Study
Zaiben Chen, The University of Queensland; Yu Zheng, Microsoft Research Asia; Heng Tao Shen, University of Queensland, Australia; Xiaofang Zhou, The University of Queensland; Xing Xie, Microsoft Research Asia
Processing Continuous Join Queries in Sensor Networks: a Filtering Approach
Mirco Stern, Universitaet Karlsruhe (TH); Erik Buchmann, Universitaet Karlsruhe (TH); Klemens Bohm, Universitaet Karlsruhe (TH)
TACO: Tunable Approximate Computation of Outliers in wireless sensor networks
Nikos Giatrakos, Unipi; Yannis Kotidis, Athens University of Economics and Business (AUEB) ; Antonios Deligiannakis, Technical University of Crete; Vasilis Vassalos, Athens University of Economics and Business; Yannis Theodoridis,

Research Session 7: Probabilistic & Uncertain Data
Session Chair: Yannis Papakonstantinou UC San Diego
GRN Model of Probabilistic Databases: Construction, Transition and Querying
Ruiwen Chen, University of Ottawa; Yongyi Mao, University of Ottawa; Iluju Kiringa, University of Ottawa
Consistent Query Answers in Inconsistent Probabilistic Databases
Xiang Lian, HKUST; Lei Chen, Hong Kong University of Science and Technology; Shaoxu Song, HKUST
Threshold Query Optimization for Uncertain Data
Yinian Qi, Purdue University; Rohit Jain, Purdue University; Sunil Prabhakar, "Purdue University, USA"; Sarvjeet Singh,
Probabilistic String Similarity Joins
Jeffrey Jestes, Computer Science Department, FSU; Feifei Li, Florida State University; Zhepeng Yan, HKUST; Ke Yi, HKUST

Research Session 8: Leveraging Hardware for Data management
Session Chair: Anastasia Ailamaki EPFL
FAST: Fast Architecture Sensitive Tree Search on Modern CPUs and GPUs
Changkyu Kim, Intel; Jatin Chhugani, Intel; Nadathur Satish, Intel Corporation; Eric Sedlar, Oracle; Anthony Nguyen, Intel; Tim Kaldewey, Oracle; Victor Lee, Intel Corporation; Scott Brandt, University of California, Santa Cruz; Pradeep Dubey, Intel
Fast In-Memory Sort on Modern CPUs and GPUs: A Case for Bandwidth-Oblivious SIMD Sort
Nadathur Satish, Intel Corporation; Changkyu Kim, Intel; Jatin Chhugani, Intel; Anthony Nguyen, Intel; Victor Lee, Intel Corporation; Daehyun Kim, Intel; Pradeep Dubey, Intel
Page-Differential Logging: An Efficient and DBMS-independent Approach for Storing Data into Flash Memory
Yi-Reun Kim, KAIST; Kyu-Young Whang, KAIST; Il-Yeol Song, Drexel University
Similarity Search and Locality Sensitive Hashing using Ternary Content Addressable Memories
Rajendra Shinde, Stanford University; Ashish Goel, Stanford University; Pankaj Gupta, ; Debojyoti Dutta,

Research Session 9: Web Data Integration
Session Chair: Magdalena Balazinska University of Washington
Automatically Incorporating New Sources in Keyword Search-Based Data Integration
Partha Talukdar, University of Pennsylvania; Zachary Ives, University of Pennsylvania; Fernando Pereira, Google
Active Knowledge: Dynamically Enriching RDF Knowledge Bases by Web Services
Nicoleta Preda, Max-Planck Institute; Fabian Suchanek, Microsoft Search Labs; Gjergji Kasneci, Max-Planck Institute for Informatics ; Thomas Neumann, Max-Planck Institute, Germany; Wenjun Yuan, Max-Planck Institute for Informatics ; Gerhard Weikum, Max-Planck Institute of Computer Sc.
Schema Clustering and Retrieval for Multi-domain Pay-As-You-Go Data Integration Systems
Hatem Mahmoud, University of Waterloo; Ashraf Aboulnaga, University of Waterloo
Expressive and Flexible Access to Web-Extracted Data: A Keyword-based Structured Query Language
Jeffrey Pound, University of Waterloo; Ihab Ilyas, U of Waterloo; Grant Weddell, University of Waterloo

Research Session 10: Social Networks & Community Data
Session Chair: Susan Davidson University of Pennsylvania
Multiple Features Fusion for Social Media Applications
Bin Cui, Peking University; Anthony Tung, National University of Singapore; Ce Zhang, PKU; Zhe Zhao, PKU
Finding Maximal Cliques in Massive Networks by H*-Graph
James Cheng, ; Yiping Ke, CUHK; Ada Fu, CUHK; Jeffrey Xu Yu, Chinese University of Hong Kong; Linhong Zhu, NTU, Singapore
K-Isomorphism: Privacy Preservation in Network Publication against structural attack
James Cheng, ; Ada Fu, CUHK; Jia Liu, Chinese University of Hong Kong
Load-Balanced Query Dissemination in Democratic Communities
Emiran Curtmola, UCSD; Alin Deutsch, UCSD; K.K. Ramakrishnan, AT&T Research Labs; Divesh Srivastava, AT&T Labs - Research

Research Session 11: Scalable Data Analytics
Session Chair: Chris Olston Yahoo! Research
Automatic Contention Detection and Amelioration for Data-Intensive Operations
John Cieslewicz, Columbia University; Kenneth Ross, Columbia University; Kyoho Satsumi, Columbia University; Yang Ye, Columbia University
Efficient Parallel Set-Similarity Joins Using MapReduce
Rares Vernica, University of California, Irvine; Michael Carey, UC Irvine; Chen Li, Univ of California, Irvine and BiMaple
ParaTimer: A Progress Indicator for MapReduce DAGs
Kristi Morton, University of Washington; Magdalena Balazinska, University of Washington; Dan Grossman, University of Washington
The DataPath System: A Data-Centric Analytic Processing Engine for Large Data Warehouses
Subi Arumugam, U Florida; Alin Dobra, UFL; Christopher Jermaine, Rice U.; Luis Perez, Rice University; Niketan Pansare, Rice University

Research Session 12: Advanced Query Processing
Session Chair: Jiaheng Lu Renmin University
Variance Aware Optimization of Parameterized Queries
Surajit Chaudhuri, Microsoft Research; Hongrae Lee, University of British Columbia; Vivek Narasayya, Microsoft Research
Positional Update Handling in Column Stores
Sandor Heman, VectorWise; Marcin Zukowski, VectorWise; Niels Nes, ; Lefteris Sidirourgos, CWI; Peter Boncz, CWI
Durable Top-k Search in Document Archives
Leong Hou U, The University of Hong Kong; Nikos Mamoulis, University of Hong Kong; Klaus Berberich, MPII; Srikanta Bedathur, MPII
Ajax-based Report Pages as Incrementally Rendered Views
Yupeng FU, UCSD; Keith Kowalczykowski, app2you Inc; Yannis Papakonstantinou, UCSD; Kevin Keliang Zhao, UCSD; Kian Win Ong, UC San Diego

Research Session 13: Cloud Computing & Internet Scale Computing
Session Chair: Mehul Shah HP Labs
An Evaluation of Alternative Architectures for Transaction Processing in the Cloud
Simon Loesing, ETH Zurich; Tim Kraska, ETH Zurich; Donald Kossmann, ETH Zurich
Indexing Multi-dimensional Data in a Cloud System
Jinbao Wang, Harbin Institute of Technology; Hong Gao, Harbin Institute of Technology; Sai Wu, National Univ. of Singapore; Beng chin Ooi, National University of Singapore
Low Overhead Concurrency Control in Partitioned DBMSs
Evan Jones, MIT; Daniel Abadi, Yale; Samuel Madden, MIT
Efficient Querying and Maintenance of Network Provenance at Internet-Scale
Wenchao Zhou, University of Pennsylvania; Micah Sherr, University of Pennsylvania; Tao Tao, University of Pennsylvania; Xiaozhou Li, University of Pennsylvania; Boon Thau Loo, University of Pennsylvania; Yun Mao, University of Pennsylvania

Research Session 14: Data Summarization
Session Chair: Lei Chen Hong Kong University of Science & Technology
Hierarchically Organized Skew-Tolerant Histograms for Geographic Data Objects
Yohan Roh, SAIT, Samsung Electronics; Jae Ho Kim, KAIST; Yon Dohn Chung, Korea University; Jin Hyun Son, Hanyang University; Myoung Ho Kim, KAIST
Logging Every Footstep: Quantile Summaries for the Entire History
Yufei Tao, Chinese University of Hong Kong; Ke Yi, HKUST; Sheng Cheng, CUHK; Jian Pei, Simon Fraser University; Feifei Li, Florida State University
Continuous Sampling for Online Aggregation Over Multiple Queries
Sai Wu, National Univ. of Singapore; Beng chin Ooi, National University of Singapore; Kian-Lee Tan, National University of Singapore
Histograms Reloaded: The Merits of Bucket Diversity
Carl-Christian Kanne , Univ. of Mannheim; Guido Moerkotte, University of Mannheim

Research Session 15: Probabilistic Data, Fuzzy Data, & Data Provenance
Session Chair: Martin Theobald Max-Planck-Institut fur Informatik
Lineage Processing over Correlated Probabilistic Databases
BHARGAV KANAGAL, University of Maryland; Amol Deshpande, Univ of Maryland
Monte Carlo Processing of Probabilistic Satisfiability Queries in MCDB
Luis Perez, Rice University; Subi Arumugam, U Florida; Christopher Jermaine, Rice U.
K-Nearest Neighbor Search for Fuzzy Objects
Kai Zheng, University of Queensland; Pui Cheong Fung, ; Xiaofang Zhou,
An Optimal Labeling Scheme for Workflow Provenance Using Skeleton Labels
Zhuowei Bao, University of Pennsylvania; Susan Davidson, University of Pennsylvania; Sanjeev Khanna, University of Pennsylvania; Sudeepa Roy, University of Pennsylvania

Research Session 16: Data Security & Privacy
Session Chair: Chris Clifton Purdue University
SecureBlox: Customizable Secure Distributed Data Processing
William Marczak, UC Berkeley; Shan Shan Huang, LogicBlox, Inc.; Martin Bravenboer, LogicBlox, Inc.; Micah Sherr, University of Pennsylvania; Boon Thau Loo, University of Pennsylvania; Molham Aref, LogicBlox
Differentially Private Aggregation of Distributed Time-Series with Transformation and Encryption
Vibhor Rastogi, University of Washington; Suman Nath, Microsoft
Non-homogeneous Generalization in Privacy Preserving Data Publishing
Wai Kit Wong, University of Hong Kong; Nikos Mamoulis, University of Hong Kong; David Cheung, University of Hong Kong
Preserving Privacy and Fairness in Peer-to-Peer Data Integration
Hazem Elmeleegy, Purdue University; Mourad Ouzzani, Purdue University; Ahmed Elmagarmid, Purdue University; Ahmad Abusalah, Purdue University

Research Session 17: Web Data Integration
Session Chair: Fatma Ozcan IBM Almaden
Structured Annotations of Web Queries
Nikos Sarkas, University of Toronto; Stelios Paparizos, Microsoft Research; Panayiotis Tsaparas, Microsoft Research
On Active Learning of Record Matching Packages
Arvind Arasu, Microsoft Research; Michaela Goetz, Cornell University; Raghav Kaushik, Microsoft Research
I4E: Interactive Investigation of Iterative Information Extraction
Anish Das Sarma, Yahoo Research; Alpa Jain, Yahoo; Divesh Srivastava, AT&T Labs - Research
ONDUX: On-Demand Unsupervised Learning for Information Extraction
Eli Vilarinho, Federal University of Amazonas; Altigran Silva, UFAM; Marcos Goncalves, UFMG; Edleno de Moura, Federal University of Amazonas

Research Session 18: Web Data Management
Session Chair: Jun Tatemura NEC Research Laboratories
Optimizing Content Freshness of Relations Extracted From the Web Using Keyword Search
Mohan Yang, Shanghai Jiao Tong University; Haixun Wang, Microsoft Research, Asia; Lipyeow Lim, ; Min Wang, HP Labs
Feeding Frenzy: Selectively Materializing Users' Event Feeds
Adam Silberstein, Yahoo! Research; Jeffrey Terrace, Princeton University; Brian Cooper, Yahoo! Research; Raghu Ramakrishnan, Yahoo! Research
Constructing and Exploring Composite Items
Senjuti Basu Roy, UTA; Sihem Amer-Yahia, Yahoo! Research; Ashish Chawla, Yahoo! Inc; Gautam Das, University of Texas at Arlington; Cong Yu,
Unbiased estimation of size and other aggregates over hidden web databases
Arjun Dasgupta, University of Texas Arlington; Xin Jin, George Washington University; Bradley Jewell, University of Texas at Arlington; Nan Zhang, George Washington University; Gautam Das, University of Texas at Arlington

Research Session 19: Graph Mining
Session Chair: Chen Li UC Irvine
Towards Proximity Pattern Mining in Large Graphs
Arijit Khan, ; Xifeng Yan, ; Kun-Lung Wu, IBM Watson Research Center
GAIA: Graph Classification Using Evolutionary Computation
Ning Jin, UNC at Chapel Hill; Calvin Young, UNC at Chapel Hill; Wei Wang, University of North Carolina at Chapel Hill
Finding Maximum Degrees in Hidden Bipartite Graphs
Yufei Tao, Chinese University of Hong Kong; Sheng Cheng, CUHK; Jianzhong Li, Harbin Institute of Technology
Connected Substructure Similarity Search
Haichuan Shang, UNSW; Xuemin Lin, University of New South Wales; Wei Wang, University of New South Wales; Jeffrey Xu Yu, Chinese University of Hong Kong; Ying Zhang, UNSW

Research Session 20: Indexing & Storage Management
Session Chair: Daniel Abadi Yale University
B^ed-Tree: An All-Purpose Tree Index for String Similarity Search on Edit Distance
Zhenjie Zhang, National University of Singapo; Beng chin Ooi, National University of Singapore; Marios Hadjieleftheriou, AT&T Labs - Research; Divesh Srivastava, AT&T Labs - Research
On Indexing Error-Tolerant Set Containment
Raghav Kaushik, Microsoft Research; Parag Agrawal, Stanford University; Arvind Arasu, Microsoft Research
Workload-Aware Storage Layout for Database Systems
Oguzhan Ozmen, University of Waterloo; Kenneth Salem, University of Waterloo; Jiri Schindler, NetApp, Inc.; Steve Daniel, NetApp, Inc.
Querying Data Provenance
Grigoris Karvounarakis, University of Pennsylvania; Zachary Ives, University of Pennsylvania, Val Tannen, University of Pennsylvania

SIGMOD TUTORIAL SESSIONS

Tutorial 1: Mining Knowledge from Databases: An Information Network Analysis Approach
Jiawei Han, Yizhou Suny, Xifeng Yanz, and Philip S. Yu
Tutorial 2: Database Systems Research on Data Mining
Carlos Ordonez and Javier Garcia-Garcia
Tutorial 3: Information theory for data management
Suresh Venkatasubramanian, and Divesh Srivastava
Tutorial 4: Enterprise Information Extraction: Recent Developments and Open Challenges
Laura Chiticariu, Yunyao Li, Sriram Raghavan, and Frederick Reiss

SIGMOD INDUSTRIAL SESSIONS

Industrial Session 1: New Platforms
Session Chair: Divy Agrawal, UC Santa Barbara
Experiences Evolving a New Analytical Platform: What Works and What's Missing
Jeff Hammerbacher (Cloudera)
Overview of SciDB: Large Scale Array Storage, Processing and Analysis
Paul Brown (SciDB)
Integrating Hadoop and parallel DBMS
Yu Xu (Teradata), Pekka Kostamaa (Teradata), Like Gao (Teradata)
A Comparison of Join Algorithms for Log Processing in MapReduce
Spyros Blanas (University of Wisconsin), Jignesh Patel (University of Wisconsin), Vuk Ercegovac , Jun Rao (IBM Research), Eugene Shekita (IBM Almaden Research Center), Yuanyuan Tian (IBM Almaden Research Center)

Industrial Session 2: Advanced Analytics
Session Chair: Berthold Reinwald, IBM Almaden Research Center
Ricardo: Integrating R and Hadoop
Yannis Sismanis (IBM Almaden) , Sudipto Das (UC Santa Barbara), Rainer Gemulla (IBM Almaden Research Center), Peter Haas (IBM Almaden Research Center), Kevin Beyer (IBM Almaden Research Center), John McPherson (IBM Almaden Research Center)
PYMK: Friend Recommendation at MySpace
Michael Moricz (MySpace.com) , Yerbolat Dosbayev (MySpace.com), Mikhail Berlyant (MySpace.com)
Forecasting High-Dimensional Data
Deepak Agarwal (Yahoo! Research), Datong Chen (Yahoo! Labs), Long-ji Lin (Yahoo! Labs), Jayavel Shanmugasundaram (Yahoo! Research) , Erik Vee (Yahoo! Research)
Datawarehousing and Analytics Infrastructure at Facebook
Ashish Thusoo (Facebook) , Dhruba Borthakur (Facebook)

Industrial Session 3: Advances in DBMSs
Session Chair: Sunil Prabhakar, Purdue University
Extreme Scale with Full SQL Language Support in Microsoft SQL Azure
Nigele Ellis (Microsoft) , Gopal Kakivaya , Dave Campbell (Microsoft)
Pay-As-You-Go - an adaptive approach to provide full context aware text search over document content
Zhen Hua Liu (Oracle) , Thomas Baby (Oracle), Sukhendu Chakraborty (Oracle), Junyan Ding (Oracle), Anguel Novoselsky (Oracle), Vikas Arora (Oracle)
Sedna: Native XML Database Management System (Internals Overview)
Dmitry Lizorkin (Institute for System Programming of the Russian Academy of Sciences)
Optimizing Tuple-store Query Execution
Scott Meyer (Metaweb Technologies Inc.), Jutta Degener (Metaweb Technologies Inc.), John Giannandrea (Metaweb Technologies Inc.), Barak Michener (Metaweb Technologies Inc.)

Industrial Session 4: Information Integration
Session Chair: Chen Li, UC Irvine
OpenII: An Open Source Information Integration Toolkit
Len Seligman (MITRE) , Peter Mork (The MITRE Corporation), Alon Halevy (Google), Ken Smith (MITRE), Michael Carey (UC Irvine), Kuang Chen (University of California at Berkeley), Chris Wolf (MITRE), Jayant Madhavan (Google), Akshay Kannan (University of California at Berkeley)
Google Fusion Tables: Data Management, Integration and Collaboration in the Cloud
Jonathan Goldberg-Kidon (Google Inc.), Hector Gonzalez (Google Inc.), Alon Halevy (Google Inc.), Christian Jensen (Google Inc.), Anno Langen (Google Inc.), Jayant Madhavan (Google Inc.), Rebecca Shapely (Google Inc.)
Visual Interfaces to Data
Chris Stolte (Tableau Software)
Graphical XQuery in the AquaLogic Data Services Platform
Vinayak Borkar (University of California, Irvine), Michael Carey (UC Irvine), Sebu Koleth (Oracle), Alex Kotopoulis (Oracle), Kautul Mehta (SAP), Joshua Spiegel (Oracle) , Sachin Thatte (Oracle), Till Westmann (SAP)

Industrial Session 5: Stream Processing
Session Chair: Graham Cormode, AT&T Research
Analytics over Continuous and DisContinuous (ACDC) Streams: The Truviso Approach
Sailesh Krishnamurthy (Truviso) , Rushan Chen (Truviso), Jeffery Davis (Truviso), Daniel Farina (Truviso), Michael Franklin (Truviso), Alan Li (Truviso), Neil Thombre (Truviso)
IBM Infosphere Streams for Scalable, Real-time, Intelligent Transportation Services
Alain Biem (IBM TJ Watson), Eric Bouillet (IBM TJ Watson), Hanhua Feng (IBM TJ Watson), Anand Ranganathan (IBM TJ Watson), Anton Ribov (IBM TJ Watson), Olivier Verscheure (IBM TJ Watson), Haris Koutsopoulos (KTH), Carlos Moran (KTH)
SIE-OBI: A Streaming Information Extraction Platform for Operational Business Intelligence
Malu Castellanos (HP Labs) , Chetan Gupta (HP Labs), Umesh Dayal (HP Labs), Song Wang (HP Labs)

SIGMOD DEMONSTRATION SESSIONS

Demo Session A: Cloud, OLAP, and XML
HadoopDB in Action: Building Real World Applications
Kamil Bajda-Pawlikowski, Yale University; Azza Abouzeid, Yale University; Jiewen Huang, Yale University; Daniel Abadi, Yale; Avi Silberschatz, Yale University
Online Aggregation and Continuous Query support in MapReduce
Tyson Condie, UC Berkeley; Neil Conway, UC Berkeley; Joseph Hellerstein, UC Berkeley; Peter Alvaro, UC Berkeley; Russell Sears, Yahoo! Research; Khaled Elmeleegy; John Gerth, Stanford University; Justin Talbot, Stanford University
MapDupReducer: Detecting Near Duplicates over Massive Datasets
Chaokun Wang, Tsinghua University; Jianmin Wang, Tsinghua University China; Xuemin Lin, University of New South Wales; Wei Wang, University of New South Wales; Haixun Wang, Microsoft Research, Asia; Hongsong Li,
Large Graph Processing in the Cloud
rishan Chen, MSRA; Xuetian Weng, MSRA; Bingsheng He, MSRA; Mao Yang, MSRA; Bo Peng, PKU
DCUBE: Discrimination Discovery in Databases
Salvatore Ruggieri, University of Pisa; Dino Pedreschi, Dipartimento di Informatica, Universita di Pisa; Franco Turini, Dipartimento di Informatica, Universita di Pisa
S-OLAP: an OLAP system for analyzing sequence data
Chun Kit Chui, The University of Hong Kong; Ben Kao, University of Hong Kong; Eric Lo, Hong Kong Polytechnic Universi; David Cheung, University of Hong Kong
ProgXe: Progressive Result Generation Framework for Multi-Criteria Decision Support Queries
Venkatesh Raghavan, Worcester Polytechnic Institut; Elke Rundensteiner, Worcester Polytechnic Institute
XTaGe: a flexible XML collection generator
Maria Perez, Universitat Jaume I; Ismael Sanz, Universitat Jaume I; Rafael Berlanga, Universitat Jaume I
K*SQL: A Unifying Engine for Sequence Patterns and XML
Barzan Mozafari, UCLA; Kai Zeng, UCLA; Carlo Zaniolo, UCLA

Demo Session B: Stream, keyword search, and Web
Symbiote - A Reconfigurable Logic Assisted Data Stream Management System (RLADSMS)
Pranav Vaidya, IUPUI; Jaehwan John Lee, IUPUI; Fracis Bowen, IUPUI; Yingzi Du, IUPUI; Chandima Hewa Nadungodage, IUPUI; Yuni Xia, IUPUI
Interactive Visual Exploration of Neighbor-Based Patterns in Data Streams
Di Yang, WPI; Zhenyu Guo, WPI; Zaixian Xie, WPI; Elke Rundensteiner, Worcester Polytechnic Institute; Matthew Ward, WPI
TwitterMonitor: Trend Detection over the Twitter Stream
Michael Mathioudakis, University of Toronto; Nick Koudas, University of Toronto
Glacier: A Query-to-Hardware Compiler
Rene Mueller, ETH Zurich; Jens Teubner, ETH Zurich; Gustavo Alonso, "ETH, Zurich"
Exploratory Keyword Search on Data Graphs
Hilit Achiezra, The Hebrew University; Konstantin Golenberg, The Hebrew University; Benny Kimelfeld, IBM Almaden; Yehoshua Sagiv, The Hebrew University
Integrating Keyword Search with Multiple Dimension Tree Views over a Summary Corpus Data Cube
Mark Sifer, University of Wollongong; Yutaka Watanobe, University of Aizu, Japan; Subhash Bhalla, University of Aizu, Japan
Query Portals: Dynamically Generating Portals for Web Search Queries
Sanjay Agrawal, Microsoft; Kaushik Chakrabarti, MSR; Surajit Chaudhuri, Microsoft Research; Venkatesh Ganti, ; Christian Konig, Microsoft; Dong Xin, MSR
Creating and Exploring Web Form Repositories
Luciano Barbosa, University of Utah; Hoa Nguyen, University of Utah; Nguyen Thanh, University of Utah; Ramesh Pinnamaneni, University of Utah; Juliana Freire, University of Utah

Demo Session C: Schema, language, and spatial
Exploring Schema Similarity At Multiple Resolutions
Ken Smith, MITRE; Craig Bonaceto, MITRE; Chris Wolf, MITRE; Beth Yost, MITRE; Michael Morse, The MITRE Corporation; Peter Mork, The MITRE Corporation; Doug Burdick, MITRE
An Automated, yet Interactive and Portable DB designer
Ioannis Alagiannis, EPFL; Debabrata Dash, Carnegie Mellon University; Karl Schnaitter, UC Santa Cruz; Anastasia Ailamaki, EPFL; Neoklis Polyzotis,
Midas: Integrating Public Financial Data
Sreeram Balakrishnan, IBM - Silicon Valley Lab.; Vivian Chu, IBM Research - Almaden; Mauricio Hernandez, IBM Reseach - Almaden; Howard Ho, IBM Research - Almaden; Rajasekar Krishnamurthy, ; Liu Shi, IBM Research - China; Jan Pieper, IBM Research - Almaden; Jeffrey Pierce, IBM Research - Almaden; Lucian Popa, IBM Research - Almaden; Christine Robson, IBM Research - Almaden; Lei Shi, IBM Research - China; Ioana Stanoi, IBM Research - Almaden; Edison Ting, IBM - Silicon Valley Lab.; Shivakumar Vaithyanathan, ; Huahai Yang, IBM Research - Almaden
Worry-Free Database Upgrades: Automated Model-Driven Evolution of Schemas and Complex Mappings
James Terwilliger, Microsoft Research; Philip Bernstein, Microsoft Corp.; Adi Unnithan, Microsoft Corporation
US-SQL: Managing Uncertain Schemata
Matteo Magnani, University of Bologna; Danilo Montesi, University of Bologna
PAROS: Pareto Optimal Route Selection
Matthias Schubert, Ludwig-Maximilians-University; Franz Graf, Ludwig-Maximilians-Universitaet Munchen; Matthias Renz, Ludwig-Maximilians-Universitaet Munchen; Hans-Peter Kriegel, University of Munich
MoveMine: Mining Moving Object Databases
Zhenhui Li, Univ. OF ILLINOIS AT URBANA-CH; Jae-Gil Lee, IBM Almaden Research Center; Jiawei Han, UIUC
PIQL: A Performance Insightful Query Language
Michael Armbrust, UC Berkeley; Stephen Tu, ; Armando Fox, UC Berkeley; Michael Franklin, UC Berkeley; David Patterson, UC Berkeley; Nick Lanham, UC Berkeley; Beth Trushkowsky, UC Berkeley; Jesse Trutna, UC Berkeley
DoCQS: A Prototype System for Supporting Data-oriented Content Query
Mianwei Zhou, UIUC; Tao Cheng, University of Illinois at Urbana-champaign; Kevin Chang, University of Illinois at Urbana-champaign

Demo Session D: New technology, and potpourri
QRelX: Generating Meaningful Queries that Provide Cardinality Assurance
Manasi Vartak, Worcester Polytechnic Institute; Venkatesh Raghavan, Worcester Polytechnic Institut; Elke Rundensteiner, Worcester Polytechnic Institute
Performing Sound Flash Device Measurements: The uFLIP Experience
Matias Bjorling, ; Lionel Le Folgoc, ; Ahmed Mseddi, ; Philippe Bonnet, IT University of Copenhagen; Luc Bouganim, ; Bjorn Jonsson,
GDR: A System for Guided Data Repair
Mohamed Yakout, Purdue University; Ahmed Elmagarmid, Purdue University; Jennifer Neville, Purdue University; Mourad Ouzzani, Purdue University
Crescando
Georgios Giannikis, ETH Zurich; Philipp Unterbrunner, ETH Zurich; Jeremy Meyer, Amadeus; Gustavo Alonso, "ETH, Zurich"; Dietmar Fauser, Amadeus; Donald Kossman, ETH Zurich
A Tool for configuring and visualizing database parameters
Vamsidhar Thummala, Duke Unviersity; Shivnath Babu, Duke University
Pluggable Personal Data Servers
Nicolas Anciaux , INRIA; Luc Bouganim, ; Yanli Guo, INRIA Paris-Rocquencourt; Philippe Pucheral, INRIA Paris-Rocquencourt; jean-jacques vandewalle, Gemalto; Shaoyi Yin, INRIA Paris-Rocquencourt
Mask: A System for Privacy-Preserving Policy-Based Access to Published Content
Mohamed Nabeel, Purdue University; Ning Shang, Purdue University; John Zage, Purdue University; Elisa Bertino,
SimDB: A Similarity-aware Database System
Yasin Silva, Purdue University; Walid Aref, Purdue University; Paul Larson, Microsoft Research
A Demonstration of FlexPref: Extensible Preference Evaluation Inside the DBMS Engine
Justin Levandoski, University of Minnesota; Mohamed F. Mokbel, Univ. of Minnesota; Mohamed Khalefa, University of Minnesota; Venkateshwar Korukanti, University of Minnesota

SIGMOD KEYNOTE TALKS

Keynote 1: The Flow of On-Line Information in Global Networks
Jon Kleinberg, Cornell University
Session chair: Divy Agarwal, UC Santa Barbara

Keynote 2: Warehouse Scale Computing
Luiz Barroso, Google
Session chair: Anastasia Ailamaki, EPFL

SIGMOD PANEL SESSIONS

Crowds, Clouds, and Algorithms: Exploring the Human Side of "Big Data" Applications
Moderator: Michael J. Franklin (UC Berkeley and Truviso, Inc.)
Panelists:
Sihem Amer-Yahia (Yahoo! Research),
AnHai Doan (Wisconsin),
Jon Kleinberg (Cornell),
Nick Koudas (U. Toronto and Sysomos, Inc.)

SIGMOD RESEARCH PLENARY SESSIONS

Plenary Session 1
SIGMOD Research Papers from Sessions 11-20

Plenary Session 2
SIGMOD Research Papers from Sessions 1-10

SIGMOD AWARDS

SIGMOD Edgar F. Codd Innovations Award
Umeshwar Dayal (HP)

SIGMOD Contributions Awards
David Lomet (Microsoft)

SIGMOD Test-of-Time Award
NiagaraCQ: A Scalable Continuous Query System for Internet Databases
Jianjun Chen (University of Wisconsin, now Microsoft), David J. DeWitt (University of Wisconsin, now Microsoft), Feng Tian (University of Wisconsin, now VMWare), Yuan Wang (University of Wisconsin, now Microsoft)

SIGMOD Jim Gray Doctoral Dissertation Award
Christopher Re

SIGMOD Best Demo Presentation
TBD

Welcome

Organization

Links

SIGMOD Program

PODS Program

For Attendees

Calls For Submissions